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(57) Abstract 

Tht invention concerns a genomic retroviral nucleic material, in isolated or purified state, at least partially functional or non-functional, 
whereof the genome comprises a reference nucleotide sequence selected from the group including sequences SEQ ID No»: 1 to 15, their 
complementary sequences, and their equivalent sequences, in particular the nucleotide sequences having, for every series of 100 contiguous 
monomers, at least 70 % and preferably at least 90 % homology with said sequences SEQ ID N*»: 1 to 15. The invention also concerns 
the application of said material. 



(57) Abr^^ 

L*invcntion conceme un materiel nucl^ique de type gdnomique retroviral, h T^tat isolf ou purifi6, au moins partieUement fonctionnel 
ou non fonctionnel, dont le g6nome comprcnd une sequence nucl66otidique de r6f6rcnce choisie dans le groupe incluant les sequences SEQ 
ID NOs: 1 h 15, leurs sequences compl6mentaires, et leurs s6quences 6quivalentes, notammeat les s6quences nucl6otidiques pr6sentant, 
pour toute suite de 100 monomferes contigus. au moins 70 % et pr6f6rcntiellement au moins 90 % d'homolpgie avec respectivement lesdites 
sequences SEQ ID NOs: 1 & 15; et les applications de ce mat6riel. 
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SEQUENCES RETROVIRAUX ENDOGENES, ASSOCIEES A DES MALADIES AUTO-IMMUNES 
ET/OU A DES PERTURBATIONS DE LA GROSSESSE 



5 La pr^sente invention concerne un nouveau matferiel 

nucleique, de type gfenomique retroviral endog%ne, 
dif f erents fragments nuclSotidiques qui le comprennent ou 
qui sont obtenus a partir dudit materiel, ainsi que leur 
utilisation pour marquer au moins une maladie auto- immune, 

10 ou une pathologie qui lui est associ^e, une grossesse 
pathologique ou un insucces de grossesse. 

Le criblage de la banque d * ADNc a 1 * aide de la 
sonde Ppol-MSRV (SEQ ID NO: 29) a permis de detecter des 
clones chevauchant permettant la reconstruction d'un ARN 

15 g^nomique putatif de 7582 nucleotides . - Par sequence 
reconstruite, on entend la sequence deduite de 
1 ' alignement des clones chevauchants - . Get ARN genomigue 
prSsente la structure R-U5-gag-pol-env-U3-R. Une 
interrogation "blastn" sur plusieurs bases de donnees, a 

20 I'aide du g§nome reconstruit, montre qu»il existe une 
quantity importante de sequences genomiques (ADN) 
apparent^es dans le ggnome humain. Environ 400 sequences 
ont §t6 identififees dans GenBank (cf figure 3) et plus de 
200 sequences dans la banque EST (Expressed Sequence Tag) , 

25 la plupart en antisens. Ces sequences sont trouvfees sur 
plusieurs chromosomes, notamment les chromosomes 5, 7, 14, 
16, 21> 22 , X, avec une forte concentration apparente de 
LTR sur le chromosome X. 

La sequence reconstruite (ARNm) est contenue 

30 Integra lement a I'intferieur du clone genomique RG083M05 
(gb AC00064) (9,6 kb) , et presente une similitude de 96% 
avec deux regions discontinues de ce clone qui contient 
Sgalement des regions r^pStees a chaque extremity . 
L* alignement des sequences exp^rimentales correspondant 

35 aux regions 5» et 3» de I'ARN genomique reconstruit avec 
1*ADN du clone R6083M05 a permis de deduire une sequence 
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LTR et d' identifier des elements caract§ristiques des 
rfetrovirus notamment ceux impliqufes dans la transcription 
inverse, k savoir le PBS (Primer Binding Site) en aval du 
LTR 5* et le PPT (PolyPurine Tract) en amont du LTR 3', On 
5 observe que 1' element U3 est extremement court en 
comparaison de celui observe chez les retrovirus de type C 
des mammiferes, et comparable en taille a la region U3 
gen§ralement d^crite chez les retrovirus de type D et les 
retrovirus aviaires. La region PBS est homologue au PBS 

10 des retrovirus aviaires, sugg^rant 1 'utilisation du 
tRNA^i^P comme amorce pour la transcription inverse. Par 
consequent, cette nouvelle f ami lie de HERV est noxtunee 
HERV-W (Human Endogenous Retrovirus) . 

L" analyse phylogenique dans la r&gion pol a montre 

15 que la famille HERV-W est phylogeniquement liee aux 
families ERV-9 et RTVL-H, et appartient done a la famille 
des retrovirus endogenes de type !• L' analyse 
phylogfenetique de la trame de lecture ouverte (ORF) de env 
montre qu'elle est plus proche des retrovirus simiens de 

20 type D et des retrovirus de la reticuloendotheliose 
aviaire que des retrovirus mammiferes de type C, suggerant 
une structure de genome chimferique C/D. 

Les arbres phylogfeniques, support§s par des hautes 
valeurs de "bootstrap" montrent que les families ERV-9 et 

25 HERV-W dSrivent de deux vagues d» insertions ind^pendantes . 
Ainsi, le(s) 61ement(s) actif{s) a I'origine de la famille 
HERV-W est (sont) distinct (s) de celui (ceux) 
du (des) quel (s) la famille ERV-9 d§rive. De plus, le PBS de 
HERV-W utilise probablement un tRNAT^:"? alors que ERV-9 

30 utilise probablement un tRNA^rg. 

Enfin, les membres de la famille HERV-W sont 
exprimfes dans le placenta, alors qu*on ne d^tecte pas les 
ARN ERV-9 dans ce tissu. 

35 
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FONCTIONS BIOLOGIQUES DE HERV-W 

L' expression de HERV-W restreinte au placenta et 
la longue trame de lecture codant potentiellement pour une 
enveloppe rfetrovirale autorisent Si proposer des fonctions 
5 biologiques physiologiques dont 1' alteration pourrait etre 
associee a des pathologies. 

expression restreinte au placenta sugg&re que 
1' expression de genes retroviraux et/ou non retroviraux 
sous la dependance des LTR peut etre hormone-dependante* 

10 Ces genes peuvent etre adjacents, ou sous la dependance de 
LTR isolSs. Une pathologie peut alors provenir d'une 
expression aberrante suite a la reactivation d'un LTR 
silencieux par divers facteurs : infection virale (par 
exemple par un membre de la f ami lie des Herpesvirus) ou 

15 activation immune locale. Un polymorphisme au niveau des 
LTR pourrait aussi favor iser ces evenements. 

L' enveloppe de HERV-W pourrait jouer un r51e 
fusogenique^ en particulier au niveau de sous-types 
cellulaires du placenta. Le peptide immunosuppresseur de 

20 cette enveloppe pourrait proteger le foetus centre 
1* agression du systeme immunitaire maternel. Enfin, par un 
m^canisme de saturation de recepteurs, 1* enveloppe de 
HERV-W pourrait jouer un r61e protecteur centre les 
infections r§trovirales exogSnes. L' alteration de 

25 1» immunity cellulaire locale peut dfecouler d'un signal 
immunostimulateur port§ par 1' enveloppe. Get effet peut 
dtre lie a une region portant une activite superantigdne, 
ou a la region immunosuppressive qui deviendrait 
immunostimulatrice S la suite, soit d'un polymorphisme, 

30 soit d'un effet-dose (surexpression) . 

La verification de ces implications et la 
comprehension des consequences liees a une alteration des 
fonctions biologiques des LTR ou de 1* enveloppe 
retroviral© endog%nes peut mener a 1 * etablissement de 

35 mithodes de diagnostic ou de suivi : 
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- d*6tats de grossesse pathologique ou d*insucces 
de grossesse, 

- de maladies auto-iitununes comme la sclerose en 
plaques ou la polyarthrite rhumatolde. 

5 Conf orxnement a la presente invention, il a ete 

decouvert, a I'etat endogene, un nouveau materiel 
nuclfeique, explicits et deer it ci-apres, ayant 
1 • organisation d • un retrovirus , et susceptible d • §tre 
correl6 a une maladie auto-immune, ou une pathologie qui 

10 lui est associee, a une grossesse pathologique ou un 
insucc^s de grossesse. 

Le materiel nucl&ique selon la presente invention, 
sous forme ARNm, repr§sente environ 8 Kb, il est 
represents a la Figure 1 et est deer it par SEQ ID NO: 11, 

15 et est represents a la Figure 2 sous forme d' ADN 
genomique • 

Par !• expression "de type retroviral", on entend 
la caracteristique selon laquelle le materiel nucleique 
considers comprend une ou des sequences nucleotidiques 

20 apparentSes a 1 ' organisation d 'un retrovirus , et/ou & ses 
sequences f onctionnelles ou codantes. 

Ce materiel nucleique de rSference s^apparente ^ 
un retrovirus endogene humain, designe par 1' expression 
HERV-W. En consequence, il peut etre obtenu par toute 

25 technique appropriSe de balayage ("screening") de toute 
banque d'ADN humain, ou d'ADNc placenta ire, comme montrS 
ci-aprSs, en particulier avec des amorces ou sondes 
nuclSiques synthStisSes pour s'hybrider avec tout ou 
partie de SEQ ID NO: 11. 

30 La presente invention concerne egalement tout 

produit nucleique ou peptidique, obtenu ou derivS a partir 
du matSriel nuclSique de reference, selon SEQ ID NO: 11, 

Et !• invention s'interesse pour terminer aux 
dif f erentes correlations pouvant Str e f aites entre le 

35 matSriel nuclSique prScitS, et/ou ses produits dSrivSs, 
avec toute maladie auto-immune et/ou une pathologie qui 



5 



lui est associ^e, ainsi qu'avec des cas de grossesse 
pathologique ou d'insuccfes de grossesse. 

Par dite "auto-iiamune" , on entend notamment : 

- la scl§rose en plaques 

5 - la polyarthrite rhumatolde 

- le lupus §ryth6inateux diss4min6 

- le diabfete insulino-d§pendant 

- et/ou les pathologies qui leur sont associees. 

10 La presente invention concerne tout d'abord un 

materiel nuclfeique de type gfenomique retroviral, a I'etat 
isol§ ou purifie, au moins partiellement fonctionnel ou 
non fonctionnel. 

Ce materiel est caract€rise en ce que son genome 
15 comprend une sequence nucleotidique de reference choisie 
dans le groupe incluant les sequences SEQ ID NOs: 1 a 15, 
leurs siquences comp 1 Omenta ires , et leurs sequences 
gquivalentes, notamment les sequences nucleotidiques 
pr^sentant, pour toute suite de 100 roonom^res contigus, au 
20 moins 50% et prfef^rentiellement au moins 70%, par exemple 
au moins 90% d'homologie avec respect ivement lesdites 
sequences SEQ ID NOs: 1 a 15. 

Ce materiel est fegalement caracterisS en ce que 
son genome comprend une sequence nucleotidique de 
25 reference, codant pour tout polypeptide presentant, pour 
toute suite contigtie d'au moins 30 acides amines, au moins 
50%, et de preference au moins 70% d'homologie avec une 
sequence peptidique susceptible d'etre codee par au moins 
une partie f onctionnelle de la sequence nucleotidique de 
30 reference telle que definie ci-dessus. 

A titre particulier, ce materiel comprend un 
fragment nucieique insere entre deux sequences 
correspondant respectivement a la region LTR et au gene 

retrovirale . notamment un 
35 fragment nucieique const itue par ou comprenant la sequence 
SEQ ID NO: 12. 



L' invention concerne aussi un materiel nucleique 
de type retroviral sous-genomique, const itue par une 
sequence nucleotidique identique a SEQ ID NO: 11, avec une 
deletion tel qu' exemplif ii par les clones cl»PH74 
5 (SEQ ID NO: 7), cl.PH? (SEQ ID NO: 8) et cl.Pi5T 
(SEQ ID NO: 9), cette deletion resultant ou non d'une 
stratfegie d'^pissage. 

Le materiel nucleique prfecedexnment defini comprend 
au moins une sequence nucleotidique f onctionnelle codant 
10 pour au moins une proteine rfetrovirale, et/ou au moins une 
sequence nucleotidique de regulation. 

L* invention concerne ensuite tout fragment 
nucleotidique d'au moins 100 bases, comprenant une 
sequence nucleotidique choisie dans le groupe comprenant : 
15 a) toutes les sequences nucleotidiques, partielles 

et totales d'un materiel nucleique tel que defini 
pr6cedemment 

b) toutes les sequences nucleotidiques, partielles 
et totales d*un clone choisi dans le groupe incluant les 
20 clones : 





Cl . 6A2 


(SEQ 


ID 


NO: 


1) 




Cl . 6A1 


(SEQ 


ID 


NO: 


2) 




C1.7A16 


(SEQ 


ID 


NO: 


3) 




cl.Pi22 


(SEQ 


ID 


NO: 


4) 




Cl.24.4 


(SEQ 


ID 


NO: 


5) 




C1.C4C5 


(SEQ 


ID 


NO: 


6) 




C1.PH74 


(SEQ 


ID 


NO: 


7) 




C1.PH7 


(SEQ 


ID 


NO: 


8) 




cl.PiST 


(SEQ 


ID 


NO: 


9) 




cl.44.4 


(SEQ 


ID 


NO: 


10) 




HERV-W 


(SEQ 


ID 


NO: 


11) 




cl . 6A5 


(SEQ 


ID 


NO: 


12) 




C1.7A20 


(SEQ 


ID 


NO: 


13) 






/ o.T?r» 


TFk 




-1 ^ \ 
/ 




LTR 


(SEQ 


ID 


NO: 


15) 
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c) les sequences respectivement complementaires 
aux sequences selon a) et b) 

d) les sequences respectivement equivalentes aux 
sequences selon a) a c) , notaminent les sequences 

5 nucleotidiques prSsentant, pour toute suite de 100 
monomeres contigus, au moins 50%, et de pr6f§rence au 
moins 70%, ou mieux au moins 80 %, par exemple au moins 
90% d'homologie avec les sequences a) a c) . 

L' invention concerne aussi toute sonde nuclfeique 

10 de d§tection d*un materiel nucl^ique, ins§re ou non dans 
un acide nucleique, caracterisee en ce qu'elle est 
susceptible de s'hybrider specif iquement sur un materiel 
nucleique, tel que dfefini precedemment . 

Une telle sonde comprend ou non un marqueur. 

15 L' invention concerne aussi une amorce nucl§ique 

pour 1* amplification par polymerisation d'un ARN ou d'un 
ADN, caracterisee en ce qu'elle comprend une sequence 
nucleotidique susceptible de s'hybrider specif iquement sur 
un materiel nuclfeique ou un fragment nucleique, tel que 

20 defini pr§c6demment • 

A titre d' exemple, une sonde nucleique ou amorce 
nucleique selon 1' invention est caracterisee en ce qu'elle 
est constitute par une sequence nucleotidique choisie dans 
le groupe incluant SEQ ID NOs: 16 S 28. 

25 L' invention concerne aussi tout ARN ou ADN, et 

notamment un vecteur de replication, comprenant un 
fragment nucleotidique, tel que dfefini precedenunent . 

invention concerne aussi tout peptide codt par 
tout cadre de lecture ouvert appartenant Sl un fragment 

30 nucleotidique, tel que dfefini pr6c6demment , notamment 
polypeptide, par exemple oligopeptide formant un 
determinant antigenique reconnu par des sera de patients 
affectfes par une maladie auto-immune, ou une pathologie 
qui lui est associee, ou de patientes ayant une grossesse 

35 pathologique ou un insuccSs de grossesse. 



A titre d" example, ce polypeptide est cod6 par un 
fragment nucleotidique comprenant un cadre de lecture 
ouvert codant pour une ou des proteines ENV retrovirales. 

Enfin, 1' invention concerne : 
5 - !• utilisation d»un materiel nucleique, ou d'un 

fragment nucleotidique, ou d'un peptide defini ci-dessus, 
tels que definis precedemment , comme marqueur molfeculaire 
d'une maladie auto-immune ou d'une pathologie qui lui est 
associee, de grossesse pathologique ou d'insucces de 
10 grossesse ; 

- 1 'utilisation d'un materiel nucleique, ou d'un 
fragment nucleotidique, tels que definis precedemment, 
comme marqueur chromosomique d'une susceptibilite a une 
maladie auto-immune ou d'une pathologie qui lui est 

15 associge, ou d'un risque d'une grossesse pathologique ou 
d'un insuccds de grossesse ; 

- 1* utilisation d'un materiel nucleique, ou d'un 
fragment nucleotidique, tels que definis precedemment, 
comme marqueur de proximite d'un gene de susceptibilite S 

20 une maladie auto-immune ou a une pathologie qui lui est 
associee, ou & un risque d'une grossesse pathologique ou 
d'un insucc^s de grossesse. 

L' invention concerne aussi un precede de marguage 
moleculaire d'une maladie auto-immune ou d'une pathologie 

25 qui lui est associee, de grossesse pathologique ou 
d'insuccSs de grossesse, caracteris^ en ce qu'on identifie 
et/ou quantifie dans tout materiel biologique corporel, 
notamment fluide corporel, tout fragment nucleotidique, 
tel que defini precedemment, soit sous forme d'ARN, soit 

30 sous forae d'ADN, 

A titre d'exemple, selon un tel precede, on 
detecte dans ledit materiel biologique corporel, des 
cellules exprimant un fragment nucleotidique, tel que 
defini pr^cfedemment • 

35 L« invention concerne une application diagnostique 

et/ou thfirapeutique d'un materiel nucleique, d'un fragment 




nucleotidique ou d'un peptide d€fini ci-dessus, et en 
cela, un autre objet de 1' invention est une composition 
diagnostique ou une composition therapeutique comprenant 
undit materiel, undit fragment ou undit peptide. 

5 

Avant de detainer 1» invention, diffferents tenaes 
utilises dans la description et les revendications sont a 
present d§finis: 

- par virus huitiain, on entend un virus susceptible 
10 d'infecter ou d'etre heberg§ par I'etre humain, 

- compte tenu de toutes les variations et/ou 
recombinaisons naturelles ou induites, pouvant etre 
rencontrees dans la pratique de la presente invention, les 
objets de cette derniere, definis ci-dessus et dans les 

15 revendications, ont §t§ exprimes en comprenant les 
Equivalents ou deriv§s des differents mat^riels 
biologiques definis ci-apres, notamment les sequences 
homologues nucleotidiques ou peptidiques, 

- le variant d'un virus ou d'un agent pathogene 
20 et/ou infectant selon 1* invention comprend au moins un 

antigene reconnu par au moins un anticorps dirig§ centre 
au moins un antigene correspondant dudit virus et/ou dudit 
agent pathogfene et/ou infectant, et/ou un genome dont 
toute partie est dfetectee par au moins une sonde 

25 d» hybridation, et/ou au moins une amorce d' amplification 
nucleotidique specif ique dudit virus et/oif agent pathogene 
et/ou infectant, notamment un genome appartenant a la 
famine HERV-W, dans des conditions d' hybridation 
d§termin&es bien connues de I'homme de l"art, 

30 - selon 1' invention, un fragment nucleotidique ou 

un oligonucleotide ou un polynucleotide est un 
enchalnement de monomeres, ou un biopolymere, caract6ris§ 
par la s§quence, inf ormationnelle ou non, des acides 
nucleiques naturels, susceptible de s*hybrider S tout 

35 autre fragment nucleotidique dans des conditions 
pr6dStermin§es, 1 'enchalnement pouvant contenir des 
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monomeres de structures chimiques diff^rentes et etre 
obtenu S partir d'une molecule d'acide nucleique naturelle 
et/ou par recombinaison genetique et/ou par synth&se 
chimique ; un fragment nucl6otidique peut etre identique a 
5 un fragment gSnomlque d'un element de la famille HERV-W 
consider^ par la present e invention, notamment un gdne de 
ce dernier, par example pol ou env dans le cas dudit 
element ; 



10 naturel d'acide nucleique, dont les elements constitutifs 
sont un Sucre, un groupement phosphate et une base azot^e; 
dans I'ARN le sucre est le ribose, dans I'ADN le sucre est 
le desoxy-2-ribose; selon qu'il s'agit de I'ADN ou I'ARN, 
la base azotge est choisie parmi 1» adenine, la guanine, 

15 I'uracile, la cytosine, la thymine; ou le nucleotide peut 
§tre modifie dans I'un au moins des trois elements 
constitutifs ; a titre d'exemple, la modification peut 
intervenir au niveau des bases, generant des bases 
modifiees telles que I'inosine, la methyl-5- 

20 d^soxycytidine, la d^soxyuridine, la 

dim§thylamino-5-desoxyuridine, la diamino-2 , 6 -purine, la 
bromo-5-d6soxyuridine et toute autre base modififee 
favor isant 1* hybridation; au niveau du sucre, la 
modification peut consister dans le remplacement d'au 

25 moins un desoxyribose par un polyamide, et au niveau du 
groupement phosphate, la modification peut consister dans 
son remplacement par des esters, notamment choisis parmi 
les esters de diphosphate, d'alkyl et arylphosphonate et 
de phosphorothioate, 

30 - par "f onctionnel" , on entend la caractSristicfue 

selon laguelle une sequence nucleotidique, un materiel 
nucleique, ou un fragment nucleotidique comprend une "une 
sequence inf ormationnelle" , 



35 suite ordonn§e de monomdres, dont la nature chimique et 
I'ordre dans un sens de r6f6rence, constituent ou non une 



- ainsi un monomdre peut etre un nucleotide 



- par 



"sequence inf ormationnelle" , on entend toute 
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information fonctionnelle de meme qualite que celle des 
acides nuclSiques naturels, par exemple une trame de 
lecture. codant pour une proteine, une sequence 
regulatrice, un site d'epissage, un site de recombinaison- 
5 - par hybridation, on entend le processus au cours 

duquel, dans des conditions operatoires appropri§es, 
notamment de stringence, deux fragments nucleotidiques, 
ayant des sequences suf f isaininent complementaires, 
s'apparient pour former une structure complexe, notamment 
10 double ou triple, de preference sous forme d'h§lice, 

- une sonde comprend un fragment nucleotidique 
synthetise notamment par voie chimique ou polymerisation, 
ou obtenu par digestion ou coupure enzymatique d'un 
fragment nucleotidique plus long, comprenant au moins six 

15 monomeres, avantageusement de 10 a 100 monomeres, de 
preference 10 a 30 monomeres, et possedant une specif icit§ 
d» hybridation dans des conditions determinees ; de 
preference, une sonde possedant moins de 10 monomeres 
n'est pas utilisee seule, mais l*est en presence d*autres 

20 sondes de taille aussi courte ou non ; dans certaines 
conditions particuliferes, il peut etre utile d'utiliser 
des sondes de taille superieure a 100 monomeres ; une 
sonde peut notamment etre utilisee S des fins de 
diagnostic et il s'agira par exemple de sondes de capture 

25 et/ou de detection, 

- la sonde de capture peut etre immobilisee sur un 
support solide par tout moyen approprie, c'est-a-dire 
directement ou indirectement, par exemple par covalence ou 
adsorption passive, 

30 - la sonde de detection peut etre marquee au moyen 

d'un marqueur choisi notamment parmi les isotopes 
radioactifs, des enzymes notamment choisis parmi la 
peroxydase et la phosphatase alcaline et ceux susceptibles 
d'hydrolyser un substrat chromogene, fluorigene ou 

35 luminescent, des composes chimiques chromophores , des 
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composes chromogenes , fluorigenes ou luminescents, des 
analogues de bases nuclfeotidiques^ et la biotine, 

- les sondes utilisfees ^ des fins de diagnostic de 
!• invention peuvent gtre mises en oeuvre dans toutes les 

5 techniques d» hybridation connues de I'homme de I'art, et 
notamment les techniques dites "DOT-BLOT", "SOUTHERN 
BLOT", "NORTHERN BLOT" qui est une technique identique & 
la technique "SOUTHERN BLOT" mais qui utilise de I'ARN 
coitime cible, la technique SANDWICH; avantageusement , on 

10 utilise la technique SANDWICH dans la presente invention, 
comprenant une sonde de capture specif ique et/ou une sonde 
de detection specif ique, etant entendu que la sonde de 
capture et la sonde de detection doivent presenter une 
sequence nucleotidique au moins partiellement differente^ 

15 - toute sonde selon la pr§sente invention peut 

s'hybrider in vivo ou in vitro sur I'ARN et/ou sur I'ADN, 
pour bloquer les ph^nomenes de replication, notamment 
traduction et/ou transcription, et/ou pour degrader ledit 
ADN et/ou ARN, 

20 - une amorce est une sonde comprenant au moins six 

monomer es, et avantageusement de 10 a 30 monomer es, 
possfedant une specif icite d« hybridation dans des 
conditions dStermin^es, pour 1' initiation d'une 
polymerisation enzymatique, par exemple dans une technique 

25 d' amplification telle que la PCR (Polymerase Chain 
Reaction), dans un procfede d ' elongation, tel que le 
sSquengage, dans une methode de transcription inverse ou 
analogue, 

- deux sequences nuclfeotidiques ou peptidiques 
30 sont dites equivalentes ou derivees I'une par rapport a 

1' autre, ou par rapport a une sequence de reference, si 
fonctionnellement les biopolymeres correspondants peuvent 
jouer sensiblement le m§me r61e, sans §tre identiques, 

35 dans la technique dans laquelle elles interviennent ; sont 
notamment equivalentes deux sequences obtenues du fait de 
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la variabilite naturelle au sein d'un meme individu, ou de 
la diversity naturelle d'un individu ei un autre au sein 
d*une ludme espece, notamment mutation spontanee de 
l*esp&ce a partir de laquelle elles ont ete identififees, 
5 ou induite, ainsi que deux sequences homologues, 
I'homologie 6tant definie ci-apres, 

- par "variabilite"^ on entend toute modification, 
spontanee ou induite d'une sequence, notamment par 
substitution, et/ou insertion, et/ou deletion de 

10 nucleotides et/ou de fragments nucleotidiques, et/ou 
extension et/ou raccourcissement de la sequence a I'une au 
moins des extremit§s; une variabilite non naturelle peut 
resulter des techniques de genie genetique utilisees, par 
exemple du choix des amorces de synthese, d^generees ou 

15 non, retenues pour amplifier un acide nucleique; cette 
variabilite peut se traduire par des modifications de 
toute sequence de depart, consideree comme reference, et 
pouvant §tre exprimees par un degre d'homologie par 
rapport a ladite sequence de reference, 

20 - I'homologie caractferise le degre d' identity de 

deux fragments nucleotidiques ou peptidiques compares ; 
elle se mesure par le pourcentage d' identity qui est 
notamment determine par comparaison directe de sequences 
nucl^oditiques ou peptidiques, par rapport a des sequences 

25 nucleotidiques ou peptidiques de reference, 

- ce pourcentage d'identite a 6te specif iguement 
determine pour les fragments nucleotidiques, notamment 
clones relevant de la pr^sente invention, et provenant 
d'un meme individu; S titre d' exemple non limitatif, le 

30 plus f aible pourcentage d ' identity observe entre les 
differents clones d'un meme individu (cf SEQ ID NOs: 13 et 
14) est d»au moins 90% et le plus f aible pourcentage 
d'identite observe entre les differents clones de deux 

1 nrl -i vi r^iic oc:+- r1 • All thoitig fiHS:. 
— • — — — — — — *- « — .... V « « , 

35 - tout fragment nucleotidique est dit equivalent 

ou derive d'un fragment de r&fference, s'il prSsente une 
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sequence nucl^otidique equivalente & la sequence du 
fragment de reference ; selcn la definition precedente, 
sent notamment equivalents a un fragment nucleotidique de 
r6f€rence : 

5 (a) tout fragment susceptible de s'hybrider au 

moins partiellement avec le complement du fragment de 
reference, 

(b) tout fragment dont I'alignement avec le 
fragment de reference conduit a mettre en Evidence des 

10 bases contigiies identiques, en nombre plus important 
qu'avec tout autre fragment provenant d'un autre groupe 
taxonomique , 

(c) tout fragment resultant ou pouvant resulter de 
la variabilite naturelle au sein d'un meme individu, et de 

15 la diversite naturelle d'un individu a un autre dans la 
meme esp^ce, a partir desquels il est obtenu, 

(d) tout fragment pouvant rfesulter des techniques 
de genie genetique appliqufees au fragment de ref§rence, 

(e) tout fragment, comportant au moins huit 
20 nucleotides contigus, codant pour un peptide homologue ou 

identique au peptide code par le fragment de reference, 

(f) tout fragment different du fragment de 
reference, par insertion, deletion, substitution d'au 
moins un monomere, extension, ou raccourcissement a I'une 

25 au moins de ses extremit^s ; par exemple, tout fragment 
correspondant au fragment de reference, flanqufe a I'une au 
moins de ses extremitfes par une sequence nucleotidique ne 
codant pas pour un polypeptide, 

- par sequence nucleotidique, partielle ou totale, 
30 d'un materiel nucieique de reference, on entend egalement 

toute sequence associee par co-encapsidation, ou par 
coexpression, ou recombinee avec ledit materiel nucieique 
de reference, 

— T^av- 1 rfo nn *>n+-Anrf notaTrnnent tout 
r**-— tr^ — j r — r f 

35 peptide d'au moins deux acides amines, notamment 
oligopeptide, proteine, extra it, separe, ou 
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substantiellement isole ou synthetise, par 1 ' intervention 
de la main de I'homme, notamment ceux obtenus par synthase 
chimique, ou par expression dans un organisme recombinant, 

- par polypeptide code de maniere partielle par un 
5 fragment nuclfeotidique, on entend un polypeptide 

presentant au moins trois acides amines codes par au moins 
neuf monomeres contigus compris dans ledit fragment 
nucleot idique , 

- un acide amine est dit analogue a un autre acide 
10 amine, lorsque leur caracteristiques physico^chimiques 

respectives, telles que polarite, hydrophobicite, et/ou 
basicite, et/ou acidite, et/ou neutrality, sont 
sensiblement les memes ; ainsi, une leucine est analogue a 
une isoleucine, 

15 - tout polypeptide est dit equivalent ou derive 

d'un polypeptide de reference, si les polypeptides 
compares ont sensiblement les memes proprietes, et 
notamment les memes proprietes antigeniques, 
immunologiques, enzymologiques et/ou de reconnaissance 

20 moleculaire ; est notamment equivalent a un polypeptide de 
reference : 

(a) tout polypeptide possedant une sequence dont 
au moins un acide amine a §te substitue par un acide amine 
analogue, 

25 (b) tout polypeptide ayant une sequence pept idique 

^quivalente, obtenue par variation naturelle ou induite 
dudit polypeptide de reference, et/ou du fragment 
nuclfeotidique codant pour ledit polypeptide, 

(c) un mimotope dudit polypeptide de reference, 

30 (d) tout polypeptide dans la sequence duquel un ou 

plusieurs acides amines de la serie L sont remplac&s par 
un acide amine de la serie D, et vice versa, 

(e) tout polypeptide dans la sequence duquel on a 
introduit une modification des chaines lateralis des 

35 acides aminfes, telle que par exemple une acetylation des 



16 



fonctions amines, une carboxylation des fonctions thiol, 
une esterif ication des fonctions carboxyliques, 

(f) tout polypeptide dans la sequence duquel une 
ou des liaisons peptidiques ont et§ modifiees, comme par 

5 exemple les liaisons carba, retro, inverse, retro- inverse, 
rSduites, et laethylene-oxy , 

(g) tout polypeptide dont au moins un antigene est 
reconnu par un anticorps dirige centre un polypeptide de 
reference, 

10 - le pourcentage d'identite caracterisant 

I'homologie de deux fragments peptidiques compares est 
selon la presente invention d'au moins 80% et de 
pr6f§rence au moins 90%, 

15 Les expressions d'ordre utilisees dans la presente 

description et les revendications, telles que "premiere 
sequence nucleotidique" ne sont pas retenues pour exprimer 
un ordre particulier, mais pour d^finir plus clairement 
1 • invention. 

20 Par detection d'une substance ou agent, on entend 

ci-aprds aussi bien une identification, qu'une 
quantification, ou une separation ou isolement de ladite 
substance ou dud it agent, 

25 L* invention sera mieux comprise la lecture de la 

description ditaillee qui va suivre faite en reference aux 
Figures annexfees dans lesquelles : 

- la Figure 1 represente, d'une part, 
1 'organisation du materiel retroviral endogene decouvert 

30 selon la presente invention, sous la forme d'un ARNm 
gfenomique putatif, et, d' autre part, la localisation des 
clones mise en oeuvre selon la presente invention, par 
rapport a cette organisation; les echelles de longueur 

35 3' UTR) sont indiqu^es dans des boltes hachur6es ; les 
regions rep6t6es dans ces deux regions flanquantes sont 




indlgu^es par des fleches noires ; les regions 
correspondant aux genes gag, pol, et env, sont indiquSs 
respect ivement, en noir, blanc et gris ; le positionnement 
de la sonde Ppol-MSRV est indiqufe ; 
5 - la Figure 2 represente une possibilite 

d» organisation genetique (ADN) , illustr6e par le clone 
RG083M05, et une strategic d'epissage liant S cette 
sequence, les clones experimentaux (ARNm) ; cette figure 
montre egalement les sites d'epissage observes par 
10 reference a 1 • organisation retrovirale ; sur cette figure 
sont en outre indiques : 

la localisation des sondes utilisees {Pgag-LB19, 
Ppro-E, Ppol-MSRV et Penv-C15) ; 

les sites donneurs (DSl et DS2) et accepteurs (ASl 
15 a AS3) d'epissage ; 

les sequences provenant du clone RG083M05, dans 
les boites en minuscules, et les sequences derivant des 
clones experimentaux placentaires (ARNm) , dans les boites 
en majuscule ; 

20 les ORFs putatives (ORFl, 0RF2 et 0RF3) ; et 

un insert de 2 Kb present sous forme ADN mais non 
dgtect^ sous forme ARN, represente sous forme de hachures 
verticales. 

Les autres conventions utilisees dans cette figure 
25 sont les memes que celles de la Figure 1. 

- la Figure 3 donne une representation de clones 
ggnomiques (ADN) correspondant aux clones d*ADNc Isolds ; 
sur cette figure, sont indiquis : 

le pourcentage de similitude vis-a-vis de 1»ARN 
30 ggnomique reconstruit (ARN Recons) ; 

la presence de sequences repStees a chaque 
extr^mite de ces genomes (repetitions) ; et 

la presence et la taille des trames de lecture 
ouverte (ORFs) * 

35 - la Figure 4 represente une analyse phylogenique 

identifiant la famille HERV-W. 




- la figure 5 represente I'alignement des regions 
flanquantes 5* et 3' du clone RG083M05 avec les regions 5' 
et/ou 3* tenninales de certains clones placentaires ; le 
tandeia CAAC flanquant les LTR 3' et 5* est souligne 
5 doubleitient sous les sequences d'ADN, la sequence LTR 
consensus de 783 pb (paires de bases) est indigu§ au bas 
de I'alignement ; le PPT en amont de 1' extremity 5' de LTR 
et le PBS en aval de 1« extremity 2* de LTR sont indiques ; 
les regions U3R et U5 sont indiquees ; les sites 

10 correspondant a la fixation du facteur de transcription 
sont soulignes et numerdtes de 1 a 6 ; la region -73 a 284 
correspond a la sequence evaluee en "CAT assay" ; * 
correspond a des sites putatifs de "capping" ; [polyA] 
indique le signal de polyadenylation. 

15 - la Figure 6 represente une sequence putative 

d'un polypeptide d'enveloppe (ORFl) de HERV-W obtenu a 
partir de 3 clones d'ADNc placentaires diff§rents ; le 
peptide leader (L) , la prot§ine de surface (SU) et la 
proteine transmembranaire (TM) sont indiquees par des 

20 fldches ; le peptide de fusion hydrophobe et la region 
carboxy transmembranaire sont soulignSs par un trait 
simple et un trait double, respectivement ; la region 
d* immunosuppression est signal§e en italiques ; les sites 
potentiels de glycosylation sont indiqu6s par des points ; 

25 les acides amines divergents sont indiqu6s sur la ligne 
inferieure ; la figure 6 presente egalement les trames de 
lecture ouverte correspondant a 0RF2 et 0RF3 tels que 
decrits a la Figure 2, et plus particulierement leurs 
homologies avec les genes de regulation ritroviraux. 

30 

Le materiel nucl§ique precedemment explicit^ a ete 
dfecouvert et caract6ris§ au terme du protocole 
experimental decrit ci-apres, 6tant entendu que ce 
protocole ne saurait limiter la portee de la presente 
35 invention et des revendications en annexe. 
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Exemple 1 

Isolement et seguen^age de fragments d*ADNc 
chevauchants 

5 Les informations concernant !• organisation de 

HERV-W ont 6t6 obtenues en testant une banque d'ADNc 
placentaire (Clontech cat#HL50l4a) avec les sondes 
Ppol-MSRV (SEQ ID NO: 29) et Penv-C15 (SEQ ID NO: 31) (cf 
Exemple 8) , et en pratiquant ensuite une technique de 

10 "gene walking" a I'aide des nouvelles sequences obtenues. 
Les experiences ont ete mises en oeuvre en se r€ferant aux 
prSconisations du fournisseur de la banque. Des 
amplifications PGR sur ADN ont egalement ete exploitfees 
pour comprendre cette organisation. 

15 Un certain nombre de clones ont ete selectionnSs 

et sequences, cf Figure 1: 

- Clone C1.6A2 (SEQ ID NO: 1) : region 5* non 
traduite de HERV-W et une partie de gag 

- Clone cl.6Al (SEQ ID NO: 2): gag et une partie 

20 de pol 

- Clone C1.7A16 (SEQ ID NO: 3): Region 3' de pol 

- Clone cl.Pi22 (SEQ ID NO: 4): region 3* de pol 
et dSbut de env 

- Clone cl.24.4 (SEQ ID NO: 5) : ARN epissfe 
25 comprenant une partie de la region 5* non traduite de 

HERV-W, la fin de pol et la region 5* de env 

- Clone C1.C4C5. (SEQ ID NO: 6) : fin de env et 
region 3» non traduite de HERV-W 

- Clone C1.PH74 (SEQ ID NO: 7) : ARN sous- 
30 gSnomique : region 5' non traduite de HERV-W, fin de pol, 

env, et region 3 • non traduite de HERV-W 

- Clone cl,PH7 (SEQ ID NO: 8) : ARN multi-episse : 
region 5» non traduite de HERV-W, fin de env et region 3» 
non traduite de HERV-W. 

35 - Clone cl.PiST (SEQ ID NO: 9) : gene pol partiel 

et region U3-R 




- Clone cl.44.4 (SEQ ID NO: 10) : region R-U5, 
gdne gag et gSne pol partiel. 

A I'aide de ces clones, en procSdant a des 
alignements de sequences, un modele de sequence totale de 
5 HERV~W a ete <§labore. Les ARN eplsses ont etfe mis en 
evidence ainsi que les sites potentiels donneurs et 
accepteurs d'epissage. L' ensemble de ces informations est 
montrfe S la Figure 2. Par etude de similitude avec des 
retrovirus existants, les entites LTR, gag, pol et env ont 
10 etfe definies. 

L' organisation genetique putative de HERV-W sous 
forme ARN est la suivante (SEQ ID NO: 11) : 
gene 1..7582 

Localisation des clones sur la sequence ARN genomique 
15 reconstruite 

C1.6A2 (1321 pb) 1-1325 ; 

C1.PH74 (535+2229= 2764 pb) 72-606 et 5353- 
7582; 

cl,24.4 (491+1457= 1948 pb) ; 115-606 et 5353- 
20 6810; 

Cl.44.4 (2372 pb) 115-2496 ; 

C1.PH7 (369+297= 666pb) 237-606 et 7017-7313; 
C1.6A1 (2938 pb) 586-3559.; 

cl.Pi5T (2785+566= 3351 pb) 2747-5557 et 7017- 
25 7582; 

C1.7A16 (1422 pb) 2908-4337; 

cl.Pi22 (317+1689 = 2006 pb) 3957-4273 et 

4476-6168; 

C1.C4C5 (1116 pb) 6467-7582 
30 5«LTR 1..120 

/note="R of 5*LTR (extremite 5' 

incertaine" 

121.. 575 

/note="U5 of 5»LTR" 
35 divers 579.. 596 

/note="PBS primer binding site pour tRNA-W" 
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divers 



divers 



10 divers 



ORF 



15 divers 



ORF 



ORF 

20 

divers 



3«LTR 



25 divers 



606 

/note=" jonction d*^pissage (site donneur 
d'epissage ATCCAAAGTG-GTGAGTAATA et site 
accepteur d'epissage CTTTTTTCAG-ATGGGAAACG 
clone RG083M05, GenBank accession 
AC000064) " 
5353 

/note="site accepteur d*epissage pour 

I'ORFl (env)" 

5560 

/note="site donneur d'epissage" 
5581. .7194 

/note="ORFl env 538 AA" 

/produit-=="enveloppe" 

7017 

/note="site accepteur ^'epissage pour ORF2 et ORFB" 

7039.. 7194 

/note="0RF2 52 AA" 

7112. .7255 

/note="0RF3 48 AA" 

7244. .7254 

/note="PPT polypurine tract" 
7256. .7582 

/note-="U3-R of 3* LTR (jonction U3-R ind§termin6e) 
7563. .7569 

signal de polyadfenylation 



30 Example 2 : 

Identification de clones genomiques (ADN) 
correspondant aux clones d"ADN isoles 

UnB interrogation "blastn" sur plusieurs bases de 
35 donn^es, S l*aide du ggnome reconstruit, montre (ju'il 
existe une quantite importante de sequences apparentSes 
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dans le genome humain. Environ 400 sequences ont 6te 
identifi&es dans GenBank et plus de 200 sequences dans la 
banque EST, la plupart en anti-sens, Les 4 sequences les 
plus signif icatives en taille et en similitude, illustrees 
5 sur la figure 3, sont les clones g^nomiques (ADN) 
suivants : 

le clone humain RG083M05 (gb AC000064) dont la 
localisation chromosoiaique est 7q21-7q22, 

le clone humain BAC378 (gb U85196, gb AE000660) 
10 correspondant au locus alpha delta du recepteur des 
cellules T, localise en 14qll-12, 

le cosmide humain Q11M15 (gb AF045450) 
correspondant a la regi^ 2lq22*3 du chromosome 21, 

le cosmide U134E6 (embl Z83850) sur le chromosome 

15 Xq22. 

La localisation des regions align§es pour chacun 
des clones est indiquee et 1 * appartenance & un chromosome 
est indiquee entre crochets. Le pourcentage de similitude 
(sans les larges deletions) entre les 4 sequences et 1»ARN 

20 gfenomique reconstruit est indique, ainsi que la presence 
de sequences repet§es a chaque extremity du genome et la 
taille des plus grandes trames de lecture (ORF) . Des 
sequences repfetees sont trouvees aux extremites de 3 de 
ces clones. La sequence reconstruite est contenue 

25 intggralement a I'intferieur du clone RG083M05 (9,6 Kb) et 
presente une similitude de 96%. Cependant le clone 
RG083H05 presente une insertion de 2 Kb situfee 
immediatement en aval^de la region 5' non traduite (5« 
UTR) . Cette insertion est egalement trouv6e dans deux 

30 autres clones g#nomiques qui presentent une dfelfetion de 
2,3 Kb imm§diatement en amont de la region 3' non traduite 
(3* UTR). Aucun clone ne contient les trois trames de 
lecture (ORFs) gag, pol et env fonctionnelles. Le clone 
RG083M05 montre une ORF de 538 acides amines (AA) 

35 correspondant a une enveloppe entidre. Le cosmide Q11M15 
contient deux grandes ORFs contigiies de 413 AA (trame 0) 




et 305 AA (trame +1) correspondant a une polyproteine pol 
tronqu6e . 

Exexnple 3 
5 Analyse phylogenigue 

Une analyse phylogenique a ete realisee au niveau 
des acldes nucleiques sur 11 sous-regions differentes de 
I'ARN genomique reconstruit, et au niveau proteique sur 2 
sous-regions differentes de env. Tous les arbres obtenus 
presentent la meme topologie quelle que soit la region 
6tudi€e, Ceci est illustre a la Figure 4 au niveau des 
acides nucleiques dans les regions LTR et pol les plus 
conservees entre les sequences obtenues et ERV-9 et RTLV- 
H. Les arbres montrent clairement que les sequences 
experimentales decrivent une nouvelle fainille distincte de 
ERV-9 et tres distincte de RTLV-H comme souligne par 
1' analyse en "bootstrap". Ces sequences sont trouvSes sur 
plusieurs chromosomes, notamment les chromosomes 5, 7, 14, 
16, 21, 22, et X avec une forte concentration apparente de 
LTR sur le chromosome X. 

La comparaison au niveau proteique entre les 
regions les plus conservees des proteines retrovirales env 
montre que la f amille HERV-W est plus proche des 
retrovirus simiens de type D et des retrovirus de la 
reticuloendothSliose aviaire que les retrovirus mammiferes 
de type C. 

Ceci suggere une structure genomique chimere C/D* 
30 

Exemple 4 

Identification des elements LTR, PPT et PBS 

La sequence reconstruite (ARN) est contenue 
35 intfegralement & I'interieur du clone genomique RG083N05 
(9,6 Kb) et pr^sente une similitude de 96 % avec deux 
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regions discontinues de ce clone qui contient egalement 
des regions rep&tees a chaque extreinite. L*alignement des 
sequences experiment ales correspondant aux regions 5* et 
3* de 1*ARN g^noinique reconstruit avec I'ADN du clone 
5 RG083M05 [5 ' (5-RG-28000-28872) et 3 • (3-RG-37500-38314) ] a 
permis de deduire une sequence LTR et d' identifier des 
§leinents caracteristiques des retrovirus, notaxnment ceux 
impliques dans la transcription inverse, a savoir PBS en 
aval du LTR 5 ' et le PPT en amont du LTR 3' (cf Figure 5). 

10 On remarque que 1' element U3 est extremement court en 
comparaison de celui observe chez les retrovirus de type C 
des Tnamitiif eres, et est comparable en taille a la region U3 
generalement decrite chez les retrovirus de type D et les 
retrovirus aviaire. La region correspondant aux bases 23 64 

15 a 2720 du clone cl.PH74 (SEQ ID NO: 7) a et§ amplifiSe par 
PGR et sous-clonee dans le vecteur pCAT3 (Promega) afin de 
rfealiser 1« evaluation de I'activite promotrice. Une 
activite significative a ete trouvfee dans des cellules 
HeLa par la methode dite du "CAT assay" montrant la 

20 f onctionnalite de la sequence promotrice du LTR. 

La region PBS est homologue au PBS des retrovirus 

aviaires. 

25 Exemple 5 

Organisation genetigue et regulation de 
1* expression 

Organisation sous forme ADN 

30 Des amplifications PGR ont ete r§alisees sur des 

clones HERV-W entiers recupferes sur banque genomique 
humaine (voir exemple 1 pour le mode d'obtention) , en 
utilisant les couples d •oligonucleotides suivants : 
U5 4992 (SEQ ID NO: 16), GAG 4619 (SEQ ID NO: 17) 

35 GAG 4782 (SEQ ID NO: 18), POL 3167 (SEQ ID NO: 19) 
POL 3390 (SEQ ID NO: 20), POL 5144 (SEQ ID NO: 21) 




POL 5145 (SEQ ID NO: 22), U5 4991 (SEQ ID NO: 23). 

Les PGR sont realisees dans les conditions 
sulvantes s 

Oligonucleotides li la concentration de 0,33 
5 microMolaire 

Tampon TAQ polymerase Boerhinger IX 
0,5 unite de TAQ polymferase Boerhinger 
Melange de dNTP a 0,25 mM chacun 
0,5 mg d'ADN humain 
10 Volume final 100 ml 

Conditions de PGR (95**C, 5 min) x 1, (95**G, 30 sec 
+ 54*»C, 30 sec + 72°C 3 min) x 35. 

Les produits de PGR ont ensuite ete deposes sur 
gel d* agarose 1% pour dtre analyses apres migration. 
15 L" ensemble des PGR donne des fragments d* amplification de 
taille attendue, excepte pour la PGR LTR-4991 — gag-4619 
qui donne un fragment de taille superieure d* environ 2 Kb 
par rapport a la taille attendue (deduite a partir des 
cDNA de la banque placentaire) . La reconstitution de 
20 HERV-W sous forme ADN endog&ne repr&sente done une entite 
d' environ 10 Kb. 

Apres clonage, sequengage et analyse de la PCR- 
4992 gag-4619, on constate la presence d'une region 
d' insertion entre LTR et gag de SEQ ID NO: 12 (clone 
25 C1.6A5). Cette region ne correspond pas a une region 
traditionnelle non traduite d*un retrovirus : pas de 
region ^ ni de PBS. 

Les produits de PGR pol-3390, pol-5144 ont 6te 
egalement clones et deux des clones obtenus ont 6t6 
30 s§quenc6s. Le resultat de ces sequences est donn§ par les 
clones C1.7A20 (SEQ ID NO: 13) et cl.7A21 (SEQ ID NO: 14). 
La comparaison de ces deux sequences nucleotidiques donne 
un score de 90% d'homologie pour la region concernee, 

■iabilite de HERV-W chez un meme 

35 individu. 

HERV-W sous forme ADN est propose la Figure 2 . 
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Organisation generals : processus de transcription 
Les diff brents clones ADNc §tant obtenus, des 
resultats acquis en PGR sur ADN, on deduit : 

- une organisation ADN de 10 Kb possedant une 
s&quence d' insertion de 2 Kb entre LTR et gag. 

Le resultat de PGR sur ADN montrant la presence 
d*un insert de 2 Kb entre les regions LTR et gag suggSre 
que les ADNc isoles dans le placenta proviennent de 
1' expression d'un genome de type RG083M05* 

- une organisation ARN de 8 Kb resultant d'une 
transcription de 10 Kb suivie d"un epissage entre LTR et 
gag permettant de restaurer une continuite RF (Region 
Flanquante) 5' gag, et donnant ainsi un ARN de 8 Kb tel 
que mis en evidence en Northern Blot. 

Les sondes gag (Pgag-LB19, SEQ ID NO: 30) et 
protease (Ppro-E, SEQ ID NO: 32) r^velent un ARN de taille 
voisine a 8 Kb, la sonde Penv-C15 (SEQ ID NO: 31) rfevele 
en plus un ARN voisin de 3,1 Kb. Deux sondes definies dans 
la region 5* non traduite, obtenues par le criblage de la 
banque cDNA relate ci-dessus (sonde P5 ' -gag-cl . 6A2 derivfee 
du clone cl.6A2 et sonde P5 ' -env-stcl. 24 . 4 derivee du clone 
cl.24.4) revfelent les deux precedents ARN et un ARN 
d« environ 1,3 Kb. Gette distribution des ARNs est typique 
de transcrits de retrovirus complexes : un ARN genomique 
codant pour gag-pro-pol, un ARN sous-genomique codant pour 
I'enveloppe, et un/des ARN multi-episse(s) codant 
potent iellement pour des genes de regulation . 

La demie vie d'un tel ARN (LTR-R-U5-Insertion-GAG- 
P0L-EN[V-U3-R-HERV-W) est vraisemblablement tres courte, 
car aucun ARN de 10 Kb n'est d§tecti en Northern Blot. Par 
analyse et comparaison de sequences, les sites potentiels 
donneurs (DSl et DS2) et accepteurs (ASl a AS3) d' epissage 
ont ete d§finis et deer its dans la Figure 2. 



Exemple 6 

Transcription dans des tissus sains 

Differents tissus humains sains ont et§ testes par 
5 une technique de Northern Blot (Human Multiple Tissue 
Northern Blot, Clontech cat# 7760-1), a I'aide des sondes 
Ppol-MSRV (SEQ ID NO: 29), Pgag-LB19 (SEQ ID NO: 30), 
Penv-C15 (SEQ ID NO: 31), Ppro-E (SEQ ID NO: 32), PS'-gag- 
C1.6A2 et P5'-env-cl.24,4, marquees comme decrit dans 

10 1' exemple 1, Les experiences ont et& realisees en suivant 
les recommandations des fabricants, et les 
autoradiographies ont ete exposees 5 jours. L' analyse des 
rfesultats revele des produits de transcription uniquement 
dans le placenta, et dans aucun des autres tissus humains 

15 testes (coeur, cerveau, poumon, foie, muscle squelettique, 
rein et pancreas) . 

Par une technique de Dot Blot ARN (Clontech : 
Human RNA Master Blot Cat# 7770-1) , et en utilisant le 
protocole experimental preconis6 par le fabricant, une 

20 quarantaine d' autres tissus, dont des tissus foetaux, ont 
6t§ testes : seul le placenta donne une r§ponse specif ique 
apres hybridation avec les sondes ^ Pgag-LB19 
(SEQ ID NO: 30) et Penv-C15 (SEQ ID NO: 31) . 

On constate qu'un signal est observe dans le rein 

25 en Dot-Blot ARN, ce qui est infirme par 1' analyse en 
Northern Blot. 

Exemple 7 

30 Identification d"un ARNm codant pour une enveloppe 

et les moyens de le detecter specif iquement 

Le criblage d'une banque d*ADNc placentaire a 
l^aide d'une sonde d§finie dans la region 5» non traduite 
35 a permis d'isoler un ADNc defini par une region 5* non 
traduite (5' NTR) , une jonction d'epissage, une sequence 
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codante, une region 3» non traduite (3" NTR) et une queue 
polyadfenylfee^ cl.PH74 (SEQ ID NO: 7) . Ce clone correspond 
a un ARN episs6 codant pour une enveloppe. Par comparaison 
de sequences entre ce cDNA et le modele de HERV-W endogSne 
5 propose selon Figure 2, on identifie une jonction 
d'epissage sur I'ARNm, jonction d'epissage mettant en 
continuite la region 5' NTR et le gene env, conduisant a 
1 • elaboration d'un ARN sous genomique episse codant pour 
le gene d* enveloppe. Ces informations ont permis de 
10 definir un oligonucleotide specifique de cet ARNm, en 
choisissant une localisation situee sur le site d'epissage 
(Oligo 5307, selon SEQ ID NO: 24). 

La mise en evidence de cette region de jonction 
permet d'etablir un precede de discrimination entre ARN et 
15 ADN retroviral endogene, en utilisant dans une PGR un 
oligonucleotide d^fini sur cette region de jonction, 
notamment un oligonucleotide choisi dans le gene env 
(Oligo 4986, selon SEQ ID NO: 25). 

Les PGR sont realisees dans les conditions 
20 suivantes : 

Oligonucleotides a la concentration de 
0,33 microMolaire 

Tampon TAQ polymerase Boerhinger IX 
0,5 unite de TAQ polymerase Boerhinger 
25 Melange de dNTP a 0,25 mM chacun 

0,5 mg d'ADN humain 
Volume final 100 ml 
Sur 10 ADN differents testes, ce type de PGR n'a 
pas permis d'obtenir de produits d* amplification. Par 
30 centre sur ADNc issu d^ARN placentaire ou de cellules 
exprimant HERV-W, cette PGR donne un produit 
d« amplification. Ce rSsultat confiinne done la nature 
specif iquement ARN de ce fragment sous-genomique. 
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Exemple 8 

Identification de sequences codantes, contenues 
dans un ARNm specif ique 

5 La strategie d'epissage decrite dans !• exemple 5 

est compatible avec la presence de trois trames de lecture 
ORFl (SEQ ID NO: 33), 0RF2 (SEQ ID NO: 34) et 0RF3 
(SEQ ID NO: 35) (cf Figure 6). 

Le criblage d'une banque d'ADNc placentaire a 

10 permis d'isoler un ADNc (SEQ ID NO: 7, cl.PH74) d§fini par 
une region 5' non tradui€e ' NTR) , une jonction 
d'epissage, une sequence codante, une region 3» non 
traduite (3' NTR) et une queue polyadenylee. La sequence 
codante est de 538 acides amines (SEQ ID NO: 33) . Les 

15 analyses effectuees sur banques de donnees permettent de 
mettre en evidence des caracteristiques d'une enveloppe 
retrovirale complete. : dSbut de traduction d'une 
polyprot^ine d' enveloppe, d'un peptide leader fortement 
hydrophobe d' environ 21 acides amines, d'une protfeine de 

20 surface SU, d'une prot§ine transmembranaire TM. Ces deux 
entites proteiques presentent differents sites potentiels 
de glycosylation. Au sein de la proteine TM, on identifie 
une region immunosuppressive. 

22 pb et 95 pb en amont du site accept eur 

25 d'epissage, on a trouve respectivement deux codons 
d' initiation susceptibles de diriger la synth&se de 52 AA 
(ORF2, SEQ ID NO: 34) et de 48 AA (0RF3, SEQ ID NO: 35). 
0RF2 consiste en une partie de I'extremite carboxy- 
terminale de env et 0RF3 correspond a une traduction 

3 0 differente mais chevauchante. 

Aucune homologie significative n'a 6t§ retrouvfee 
par interrogation "blast". Cependant une interrogation 
LFASTA dans une sous-banque de .donn§e limitfee aux 
Retrovir idae, ORF2 et 0RF3 ont montr§ un pourcentage 

35 d'idenditfi de 35 % avec, respectivement. Rex du virus T- 
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lymphotrope humain et primate, et avec Tat du virus siaisn 
de 1 ' iminunodef icience. 



5 Exemple 9 

Complexite de la fzunille HERV-W 

Le nombre de copies pr#sentes dans le genome 
humain de chacune des sequences est 6valu6 par une 

10 technique de Dot Blot, a I'aide des sondes Pgag-LB19 

(SEQ ID NO: 30), Ppro-E (SEQ ID NO: 32) et Penv-C15 
(SEQ ID NO: 31) . 

Chacune des sondes est d^naturee et d§pos6e sur 
une membrane Hybond N+ a raison de 2,5, 5, lo, 25, 50, 

15 100 pg par d6p6t. 0,5 mg d'ADN humain sont egalement 
dSposSs sur la meme membrane. Les membranes sont s§ch6es 
2 heures sous vide d 80»C. Les membranes sont ensuite 
hybridees avec la sonde d§pos6e. Les techniques de 
marquage des sondes, d» hybridation et de lavage des 

20 membranes sont les m€mes que pour le Southern Blot. Apr%s 
autoradiographic des membranes, on constate des niveaux 
d' intensity de signal proportionnels aux d6p5ts sur 
membrane. AprSs dficoupage des zones d« hybridation, un 
comptage en scintillation est r^alisg. Par comparaison 

25 entre la gamme de dilution de la sonde dgpos^e sur 
membrane et le r6sultat obtenu avec I'ADN humain, on peut 
^valuer le nombre de copie par genome haplolde de chacune 
des regions couvertes par les sondes : 

- le nombre de gag endogene est evalu6 de 56 a 112 
30 copies (76) 

- le nombre de protease endogdne est 6valu6 de 166 
a 334 copies (260) 

- le nombre de env endogSne est gvaluS infgrieur H 

1 — \ — / » 

Le criblage de 10^ clones d'une banque d'ADN 
placentaire humain (Clontech cat# Hl5014b) a permis de 
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d^nombrer 144 clones reconnus par la sonde Pgag-LB19, et 
64 clones reconnus par la sonde Penv-C15. 13 clones 

hybrides conjointement par les sondes Penv-C15 et 

Pgag-LB19 ont §t§ isoles, confirmant la presence de 

5 plusieurs copies d'un genome poss§dant k la fois gag et 
env, sans consideration de fonctionnalit^. 

Le materiel nucl^ique, les sequences 

10 nucleotidiques, et les peptides ou proteines 
eventuellement exprimees par lesdits materiels et 
sequences, peuvent etre utilises pour detecter, pr^voir, 
traiter et suivre toute maladie auto-immune, et les 
pathologies qui lui sont associ^es, ainsi que des cas de 
15 grossesse pathologique ou d'insuccfes de grossesse. 

En effet, les donnees objectives et experiment a les 
permettent de relier retrovirus et maladies auto-immunes 
et retrovirus et perturbations de la grossesse : 

(1) des mecanismes communs sont mis en oeuvre dans 
20 les pathologies retrovirales et dans des maladies auto- 
immunes (presence d'auto-anticorps, de complexes immuns, 
infiltration cellulaire de certains tissus, troubles 
neurologiques) . 

(2) des desordres pathologiques comparables a 
25 certaines maladies auto-immunes apparaissent lors des 

infections par les retrovirus HIV et HTLV (syndrome de 
Sjogren, lupus erythemateux dissemine, arthrite 
rhumatoide, . • ) • 

(3) une activite transcriptase inverse a ete 
30 detectee et des particules de type retroviral ont ete 

observees dans les surnageants de cultures cellulaires de 
patients atteints de sclerose en plaques (Perron et coll, 
Res. Virol- 1989; 140: 551-561 / Lancet 1991; 337: 862-863 
/ Res. Virol. 1992; 143: 337-350) ou de polyarthrite 
35 rhumatoide. 




(4) des pathologies animales inf lamin^toires 
chroniques ou auto-immunes sont liees aux retrovirus 
endogenes; certaines d'entre elles sont utilis6es comiae 
modeles animaux de maladies humaines (diabSte insulino- 

5 dependant, lupus erythemateux diss^minfe) . 

(5) des taux . signif icatif s d'anticorps anti- 
rStrovirus endogenes ont ete decrits dans le cadre de 
maladies auto-immunes, systemiques ou inf lammatoires; 
d*autres donnees dans ce sens ont ete communiquees par 

10 plusieurs auteurs au IVeme meeting europeen sur les 
retrovirus endogenes (Uppsala, octobre 1996). D*apres 
Venables (communiques du IVeme meeting europeen sur les 
retrovirus endogenes, Uppsala, octobre 1996) , on retrouve 
un taux d'anticorps anti-HERV-H signif icativement eleve 

15 pendant la grossesse mais aussi dans le cadre de divers 
desordres auto-immuns tels que le syndrome de Sjogren, le 
lupus Erythemateux disseminE ou la polyarthrite 
rhumatolde, sans toutefois qu'une preuve de son 
implication directe puisse etre apportee a ce jour. 

20 L* implication des retrovirus dans le phenomSne 

d'auto-immunite reste compatible avec le caractere 
multifactoriel des maladies auto-immunes, systemiques ou 
inf lammatoires qui conf rontent des f acteurs genetiques , 
hormonaux, environnementaux et infectieux. 

25 Les particules observees dans les surnageants de 

cultures cellulaires de patients atteints de sclerose en 
plaques (Perron et coll, Res. Virol. 1989; 140: 551-561 / 
Lancet 1991; 337: 862-863 / Res. Virol. 1992; 143: 337- 
350) ou de polyarthrite rhumatolde (donnees non publiees) 

30 peuvent resulter de 1 • expression: (i) d»un retrovirus 
endogene competent pour la replication, (ii) de plusieurs 
retrovirus endogfenes d6f ectif s cooperant par un phenomfene 
de transcompiementation ou (iii) d'un retrovirus exogSne. 

Toutes ces observations permettent d'utiliser et 

35 considerer les materiels biologiques precedemment decrits. 
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comitie marqueur d*une maladie auto-immune ou de 
perturbations de la grossesse. 

En particulier, les techniques de marquage 
suivantes sont considerees : 

- balayage du genome humain avec des sondes 
d' hybridation a forte stringence, derivSes du materiel 
nucleique prec^demment deer it, 

- amplification directe d'ADN genomique par PGR, 
en utilisant des amorces sp§cif iques pour la region 
consider^e 

- analyse des regions f lanquantes de genes 
cellulaires etrangers. 
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REVENDICATIONS 
1/ Materiel nucleique de type genoiaigue 
r§troviral, a 1 ' §tat isole ou purif ie, au moins 
partiellement fonctionnel ou non fonctionnel, dont le 
5 genome comprend une sequence nucleotidique de r&f erence 
choisie dans le groupe incluant les sequences 
SEQ ID NOs: 1 a 15, leurs sequences complementaires, et 
leurs sequences equivalentes, notamment les sequences 
nucleotidiques presentant, pour toute suite de 100 

10 monomeres contigus, au moins 7 0% et pref erentiellement au 
moins 9 0% d*homologie avec respect ivement lesdites 
sequences SEQ ID NOs: la 15. 

2/ Materiel nucleique de type genomique 
retroviral, a I'etat isole ou purifie, au moins 

15 partiellement fonctionnel ou non fonctionnel, dont le 
genome comprend une sequence nucleotidique de reference, 
codant pour tout polypeptide presentant, pour toute suite 
contigiie d'au moins 3 0 acides amines, au moins 80%, et de 
preference au moins 90% d'homologie avec une sequence 

20 peptidique susceptible d ' etre cod6e par au moins une 
partie f onctionnelle de la sequence nucleotidique de 
reference selon la revendication 1. 

3/ Materiel nucleique de type genomique retroviral 
selon I'une quelconque des revendications 1 et 2, 

25 comprenant un fragment nucleique insure entre deux 
sequences correspondant respectivement a la region LTR et 
au g§ne gag de la structure genomique retrovirale, 
notamment un fragment nucleique constitue par ou 
comprenant la sequence SEQ ID NO: 12. 

30 4/ Materiel nucleique de type retroviral sous- 

genomique, constitue par une sequence nucleotidique 
identique S SEQ ID NO: 11, avec au moins une deletion, 
telle qu'une sequence choisie parmi SEQ ID NOs: 7 a 9. 

5/ Materiel nucleiaue selon I'une Quelconque des 

~ w — ~ ~ 

35 revendications 1 et 4, comprenant au moins une sequence 
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nucleotidique f onctionnelle codant pour au itioins une 
proteine retrovirale. 

6/ Materiel nucleique selon I'une quelconque des 
revendications 1 et 4, comprenant au moins une sequence 
5 nucleotidique de regulation. 

7/ Fragment nucleotidique d'au moins 100 bases, 
comprenant une sequence nucleotidique choisie dans le 
groupe comprenant : 

a) toutes les sequences nucleotidiques, partielles 
10 et totales d'un materiel nucleique selon I'une quelconque 

des revendications 1 a 6 

b) toutes les sequences nucleotidiques, partielles 
et totales d'un clone choisi dans le groupe incluant les 
clones : 



15 




Cl . 6A2 


(SEQ 


ID 


NO: 


1) 






C1.6A1 


(SEQ 


ID 


NO: 


2) 






C1.7A16 


(SEQ 


ID 


NO: 


3) 






cl.Pi22 


(SEQ 


ID 


NO: 


4) 






cl.24.4 


(SEQ 


ID 


NO: 


5) 


20 




C1.C4C5 


(SEQ 


ID 


NO: 


6) 






C1.PH74 


(SEQ 


ID 


NO: 


7) 






cl . PH7 


(SEQ 


ID 


NO: 


8) 






cl.PiST 


(SEQ 


ID 


NO: 


9) 






Cl.44.4 


(SEQ 


ID 


NO: 


10) 


25 




HERV-W 


(SEQ 


ID 


NO: 


11) 






cl. 6A5 


(SEQ 


ID 


NO: 


12) 






C1.7A20 


(SEQ 


ID 


NO: 


13) 






C1.7A21 


(SEQ 


ID 


NO: 


14) 






LTR 


(SEQ 


ID 


NO: 


15) 



3 0 c) les sequences respectivement complementaires 

aux sequences selon a) et b) 

d) les sequences respectivement equivalentes aux 
sequences selon a) a c) , notamment les sequences 
nuclfeotidi^'ues '^resentant . oout toute suite de 100 

35 monomeres cc ^ -s, r. >u%, et . ^rence au 
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moins 70%, par exemple au moins 9 0% d'homologie avec les 
sequences a) a c) • 

8/ Sonde nucleique de detection d*un laateriel 
nucleique, insure ou non dans un acide nucleique, 
5 caracterisee en ce qu'elle est susceptible de s'hybrider 
specif iquement sur un materiel nucleique, selon l*une 
quelconque des revendications 1 a 6, ou un fragment 
nucleique selon la revendication 7. 

9/ Sonde selon la revendication 8, caracterisee en 
10 ce qu'elle comprend un marqueur. 

10/ Amorce nucleique pour 1 ' amplification par 
polymerisation d'un ARN ou d'un ADN, caracterisee en ce 
qu'elle comprend une sequence nucleot idique susceptible de 
s'hybrider specif iquement sur un materiel nucleique selon 
15 I'une quelconque des revendications 1 a 6, ou un fragment 
nucleique selon la revendication 7 . 

11/ Sonde nucleique ou amorce nucleique 
caracterisee en ce qu'elle est constituee par une sequence 
nucleotidique choisie dans le groupe incluant 
20 SEQ ID NOs: 16 a 28. 

12/ ARN OU ADN, et notamment vecteur de 
replication, comprenant un fragment nucleotidique selon la 
revendication 7. 

13/ Peptide code par tout cadre de lecture ouvert 
25 appartenant S un fragment nucleotidique selon la 
revendication 7, notamment polypeptide, par exemple 
oligopeptide formant un determinant antigenique reconnu 
par des sera de patients affectes par une maladie auto- 
immune, ou une pathologie qui lui est associfee, ou par des 
30 patientes ayant une grossesse pathologique ou un insucces 
de grossesse. 

14/ Peptide selon la revendication 13, caracterise 
en ce qu'il est code par un fragment nucl€otidique 

35 des prot^ines ENV retrovirales . 
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15/ Utilisation d'un materiel nucleique selon les 
j^evendications 1 a 6, ou d*un fragment nucleotidique selon 
la revendication 7, ou d'un peptide selon la revendication 
13 ou 14, comme marqueur moleculaire d'une maladie auto- 
5 immune ou d'une pathologie qui lui est associee, ou d'une 
grossesse pathologique ou d'un insucces de grossesse. 

16/ Utilisation d»un materiel nucleique selon les 
revendications 1 a 6, ou d'un fragment nucleotidique selon 
la revendication 7, comme marqueur chromosomique d'une 

10 susceptibility a une maladie auto- immune ou d'une 
pathologie qui lui est associee, ou d'un risque d'une 
grossesse pathologique ou d'un insucces de grossesse. 

17/ Utilisation d'un materiel nucleique selon les 
revendications 1 a 6, ou d'un fragment nucleotidique selon 

15 la revendication 1, comme marqueur de proximite d'un gene 
de susceptibilite a une maladie auto-immune ou a une 
pathologie qui lui est associee, ou a un risque d'une 
grossesse pathologique ou d'un insucces de grossesse, 

18/ Precede de marquage moleculaire d'une maladie 

20 auto-immune ou d'une pathologie qui lui est associee, 
d'une grossesse pathologique ou d'un insucces de 
grossesse, caractferis6 en ce qu'on identifie et/ou 
quantifie dans tout materiel biologique corporel, 
notamment fluide corporel, tout fragment nucleotidique 

25 selon la revendication 7, soit sous forme d'ARN, soit sous 
forme d'ADN. 

19/ Proced§ selon la revendication 18, caracterise 
en ce qu'on d^tecte dans ledit materiel biologique 
corporel, des cellules exprimant le fragment nucleotidique 
30 selon la revendication. 

20/ Composition diagnostique ou therapeutique 
comprenant un materiel nucleique selon les revendications 
1 a 6, ou un fragment nucleotidique selon la revendication 



«««« ^^v^4--ir4A e^r^lf^iry la r^O-l/onH 1 I" T OTl 1 nil 14., 
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sonde pol-MSRV (678 bp) 



CI.6A1 (2938 bp) 
C1.6A2 (1321 bp) 
CI.7A16 (1422 bp) 
cl.Pi5T (3351 bp) 
cl.Pi22 (2006 bp) 
cl.44.4 (2372 bp) 
cl.24.4 (1948 bp) 
C1.PH74 (2764 bp) 
cLPH7 (666 bp) 
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LISTAGE DE SEQUENCES 

(1) INFORMATIONS GENERALES: 

(i) DEPOSANT: 

(A) NOM: BIO MERIEUX 

(B) RUE: CHEMIN DE L'ORME 

(C) VILLE: MARCY L*ETOILE 

(E) PAYS: FRANCE 

(F) CODE POSTAL: 69280 

(ii) TITRE DE L* INVENTION: MATERIEL NUCLEIQUE DE TYPE GENOMIQUE 
RETROVIRAL ENDOGENE, ASSOCIE A UNE MALADIE AUTO- IMMUNE ET/OU A DES 

PERTURBATIONS DE LA GROSSESSE ; UTILISATION EN TANT QUE MARQUEUR 
15 

(iii) NOMBRE DE SEQUENCES: 35 

(iv) FORME DECHIFFRABLE PAR ORDINATEUR: 
(A) TYPE DE SUPPORT: Floppy disk 
20 (B) ORDINATEUR: IBM PC compatible 

(C) SYSTEME D' EXPLOITATION: PC-DOS/MS-DOS 

(D) LOGICIEL: Patentin Release #1,0, Version #1.30 (OEB) 



5 



10 



25 (2) INFORMATIONS POUR LA SEQ ID NO: 1: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1321 paires de bases 

(B) TYPE: nucleotide 

30 (C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin§aire 

(ii) TYPE DE MOLECULE: ARNm (en ADN) 

35 (iii) HYPOTHETIQUE: NON 



FEUILLE DE REMPLACEMENT (REGLE 26) 



m 




2 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 1: 
CAACAATCGG GATATAAACC CAGGCATTCG AGCTGGCAAC AGCAGCCCCC CTTTGGGTCC 



CTTCCCTTTG TATGGGAGCT GTTTTCATGC TATTTCACTC TATTAAATCT TGCAACTGCA 
CTCTTCTGGT CCATGTTTCT TACGGCTCGA GCTGAGCTTT TGCTCACCGT CCACCACTGC 
10 TGTTTGCCAC CACCGCAGAC CTGCCGCTGA CTCCCATCCC TCTGGATCCT GCAGGGTGTC 
CGCTGTGCTC CTGATCCAGC GAAGCGCCCA TTGCCGCTCC CAATTGGGCT AAAGGCTTGC 
CATTGTTCCT GCACGGCTAA GTGCCTGGGT TTGTTCTAAT TGAGCTGAAC ACTAGTCACT 

15 

GGGTTCCATG GTTCTCTTCT GTGACCCACG GCTTCTAATA GAACTATAAC ACTTACCACA 
TGGCCCAAGA TTCCATTCCT TGGAATCCGT GAGGCCAAGA ACTCCAGGTC AGAGAATACG 
20 AAGCTTGCCA CCATCTTGGA AGCGGCCTGC TACCATCTTG GAAGTGGTTC ACCACCATCT 
TGGGAGCTCT GTGAGCAAGG ACCCCCCGGT AACATTTTGG CAACCACGAA CGGACATCCA 
AAGTGATGGG AAACGTTCCC CGCAAGACAA AAACGCCCCT AAGACGTATT CTGGAAAATT 



GGGAACAATT TGACCCTCAG ACACTAAGAA AGAAACGACT TATATTCTTC TGCAGTGCCG 
CCTGGCACTC CTGAGGGAAG TATAAATTAT AACACCATCT TACAGCTAGA CCTCTTTTGT 
30 AGAAAAGGCA AATGGAGTGA AGTGCCATAA GTACAAACTT TCTTTTCATT AAGAGACAAC 
TCACAATTAT GTAAAAAGTG TGATTTATGC CCTACAGGAA GCCTTCAGAG TCTACCTCCC 



T^Tr*r>ni^n.r*^ n^nnnmnrTn r"rTrrnr»&rT TAATA_AGGAC CCCCCTTCAA CCCP^^^'^^^'^ 



CCAAAAGGAG ATAGACT^AAA GGGTAAACAG TGAACCAAAG AGTGCCAATA TTCCCCAATT 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 



35 



FEUILLE DE REMPLACEMENT (REGLE 26) 



ATGACCCCTC CAAGCAGTGG GAGGAAGAGA ATTCGGCCCA GCCAGAGTGC ATGTGCCTTT 1080 



TTCTCTCCCA GACTTAAAGC AAATAAAAAC AGACTTAGGT AAATTCTCAG ATAACCCTGA 1140 



TGGCTATATT GGTGTTTTAC AAGGGTTAGG ACAATTCTTT GATCTGACAT GGAGAGATAT 1200 



ATATGTCACT GCTAAATCAG ACACTAACCC CAAATGAGAG AAGTGCCACC ATAACTGCAG 1260 



10 CCTGAGAGTT TGGCGATCTC TGGTATCTCA GTCAGGTCAA TGATAGGATG ACAACAGAGG 1320 



15 (2) INFORMATIONS POUR LA SEQ ID NO: 2: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2938 paires de bases 

(B) TYPE: nucleotide 

20 (C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ARNm (en ADN) 

25 (iii) HYPOTHETIQUE : NGN 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 2: 



1321 



30 



CAACGACGGA CATCCAAAGT GATGGGAAAC GTTCCCCGCA AGACAAAAAC 6CCCCTAAGA 60 



CGTATTCTGG AGAATTGGGA CCAATTTGAC CCTCAGACAC TAAGAAAGAA ACGACTTATA 120 



TTCTTCTGCA GTGCCGCCTG GCACTCCTGA GGGAAGTATA AATTATAACA CCATCTTACA 180 
35 GCTAGACTTC TTTTGTAGAA AAGGCAAATG GAGTGAAGTG CCATAAGTAC AAACTTTCTT 240 



FEUILLE DE REMPLACEMENT (REGLE 26) 



TTCATTAAGA GACAACTCAC AATTATGTAA AAAGTGTGAT TTATGCCCTA CAGGAAGCCT 300 

TCAGAGTCTA CCTCCCTATC CCAGCATCCC CGACTCCTTC CCCAACTAAT AAGGACCCCC 360 

5 CTTCAACCCA AATGGTCCAA AAGGAGATAG ACAAAAGGGT AAACAGTGAA CCAAAGAGTG 420 

CCAATATTCC CCAATTATGA CCCCTCCCAA GCAGTGGGAG GAAGAGATTC GGCCCAGCCA 480 

GAGTGCATGT GCTTTTTCTT CTCCCAGACT TAAAGCAAAT AAAAACAGAC TTAGGTAAAT 540 

10 

TCTCAGATAA TCCTGATGGC TATATTGATG TTTTACAAGG GTTAGGACAA TTCTTTGATC 600 

TGACATGGAG AGATATAATG TCACTGCTAA ATCAGACACT AACCCCAAAT GAGAGAAGTG 660 

15 CCACCATAAC TGCAGCCTGA GAGTTTGGCG ATCTCTGGTA TCTCAGTCAG GTCAATGATA 720 

GGATGACAAC AGAGGAAAGA GATGATCCCC ACAGCCAGCA AGCAGTTCCC AGTCTASACC 780 

CTCATTGGGG ACACAGAAAT CAGTAACATG GGAGATTGGT GCTGCAGACA TTTGCTAACT 840 

20 

TGTGTGCTAC AAGGACTAAG GAAAACTACG AAGAAAATCT ACGAATTACT CAATGATGTC 900 

CACCATAACA CAGGGGAAGG GAAGAAAATC CTACTGCCTT TCTGGAGAGA CTAAGGGAGG 960 

25 CATTGAGGAA GCGTGCCTCT CTGTCACCTG ACTCTTCTGA AGGCCAACTA ATCTTAAAGC 1020 

GTAAGTTTAT CACTCAGTCA GCTGCAGACA TTAGAAAAAA CTTCAAAAGT CTGCCGTAGG 1080 

CCCGGAGCAA AACTTAGAAA CCCTATTGAA CTTGGCAACY TCGGTTTTTT ATAATAGAGA 1140 

30 

TCAGGAGGAG CAGGCGGAAC AGGACAAACG GGATTAAAAA AAAGGCCACC GCTTTAGTCA 1200 

TGACCCTCAG GCAAGTGGAC TTTGGAGGCT CTGGAAAAGG GAAAAGCTGG GCAAATTGAA 1260 

35 TGCCTAATAG GGCTTGCTTC CAGTGCGGTC TACAAGGACA CTTTAAAAAA GATTGTCCAA 1320 



FEUILLE DE REMPLACEMENT (REGLE 26) 



5 

GTAGAAGTAA GCCGCCCCTT CGTCCATGCC CCTTATTTCA AGGGAATCAC TGGAJVGGGCC 13 SO 
ACTGCCCCAG GGGACAAAGG TCTTTTGAGT CAGAAGCCAC TAACCAGATG ATCCAGCAGC 1440 
5 AGGACTGAGG GTGCCTGGGG CAAGCGCCAT CCCATGCCAT CACCCTCACA GAGCCCTGGG 1500 
TATGCTTGAC CATTGAGGGC CAGGAAGGTT GTCTCCTGGA CACTGGTGCG GTCTTCTTAG 1560 
TCTTACTCTT CTGTCCCGGA CAACTGTCCT CCAGATCTGT CACTATCTGA GGGGGTCCTA 1620 

10 

AGACGGGCAG TCACTAGATA CTTCTCCCAG CCACTAAGTT ATGACTGGGG AGCTTTATTC 1680 
TTTTCACATG CTTTTCTAAT TATGCTTGAA AGCCCCACTA CCTTGTTAGG GAGAGACATT 1740 
15 CTAGCAAAAG CAGGGGCCAT TATACACCTG AACATAGGAG AAGGAACACC CGTTTGTTGT 1800 
CCCCTGCTTG AGGAAGGAAT TAATCCTGAA GTCTGGGCAA CAGAAGGACA ATATGGACGA 1860 
GCAAAGAATG CCCGTCCTGT TCAAGTTAAA CTAAAGGATT CCACTTCCTT TCCCTACCAA 1920 

20 

AGGCAGTACC CCCTCAGACC CAAGGCCCAA CAAGGATTCC AAAAGATTGT TAAGGACTTA 1980 
AAAGCCCAAG GCTTAGTAAA ACCATGCATA ACTCCCTGCA GTAATTCCGT AGTGGATTGA 2040 
25 GGAGGCACAG AAACCCAGTG GACAGTGGAG GGTTAGTGCA AGATCTCAGG ATTATCAATG 2100 
GAGGCCGTTG TCCTTTTATA CCCAGCTGTA CCTAGCCCTT ATACTGTGCT TTCCCAAATA 2160 
CCAGAGGAAG CAGAGTGGTT TACACTCCTG GACCTTAAGG ATGCCTTCTT CTGCATCCCT 2220 

30 

GTACATCCTG ACTCTCAATT CTTGTTTGCC TTTGAAGATA CTTCAAACCC AACATCTCAA 2280 
CTCACCTGGA CTGTTTTACC CCAAGGGTTC AGGGATAGCC CCv:arC AIT TOGCCAGGCA 2340 
35 TTAGCCCAAG ACTTGAGCCA ATCCTC. TAG CTGGACACTT GTCCTTCGGT AGGTGGATGA 2400 



FEUILLE DE 



6 

TTTACTTTTG GCCGCCCATT CAGAAACCTT GTGCCATCAA GCCACCCAAG CGCTCTTCAA 2460 
TTTCCTCGCT ACCTGTGGCT ACATGGTTTC CAAACCAAAG GCTCAACTCT GCTCACAGCA 2520 
5 GGTTACTTAG GGCTAAAATT ATCCAAAGGC ACCAGGGCCC TCAGTGAGGA ACACATCCAG 2580 
CCTATACTGG CTTATCCTCA TCCCAAAACC CTAAAGCAAC TAAGGGGATT CCTTGGCGTA 2640 
ATAGGTTTCT GCCGAA7VATG GATTCCCAGG TTTGGCGAAA TAGCCAGGTC ATTAAATACA 2700 

10 

CTAATTAAGG AAACTCAGAA AGCCAATACC CATTTAGTAA GATGGACAAC TGAAGTAGAA 2760 
GTGGCTTTCC AGGCCCTAAC CCAAGCCCCA GTGTTAAGTT TGCCAACAGG GCAAGACTTT 2820 
15 TCTTCATATG TCACAGAAAA AACAGGAATA GCTCTAGGAG TCCTTACACA GATCCGAGGG 2880 
ATGAGCTTGC AACCTGTGGC GTACCTGACT AAGGAAATTG ATGTAGTGGC AAAGGGTT 2938 



20 (2) INFORMATIONS POUR LA SEQ ID NO: 3: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1422 paires de bases 

(B) TYPE: nucleotide 

25 (C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin§aire 

(ii) TYPE DE MOLECULE: ARNm (en ADN) 

3 0 (iii) HYPOTHETIQUE: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 3: 

35 

ACCTGGACAC TCTTGTCCTT CAGTATGTG6 ATGATTTACT TTTAGCTGCC TGTTCAGAAA 120 



FEUILLE DE REMPLACEMENT (REGLE 26) 



CCTTGTGCCA TCAAGCCACC CAAGCACTCT TAAATTTCCT CGCCACCTGT GGCTACAAGG 180 

TTTCCAAAGA GAAGCTCAGC TCTGCTCACA GCAGGTTAAA TACTTAGGAC TAAGATTATC 240 

5 

CAAAGGCACC AAGGCCCTCA GTGAGGAATG TATCCAGCCT ATACTGGCTT ATCCTCATCT 300 

CAAAACCCTA AAGCAACTAA GAGAGTTCCT TGGCATAACA GGCTTCTGCC GAATATGGAT 360 

10 TCCCCAGGTA TGGCAAAATA GCCAGGCCAT TATATACAGT AATTAAGGAA ACTCAGAAAG 420 

CCAATACCCA TTTAATAAGA TGGATACCTG AAGCCAAAGT GGCTTTCCAG GCCCCTAAAG 480 

AAGGCCTTAA ACCCAAGTCC CAGTGTTAAG CTTGCCAACG GGGCAAGACT TTTCTTTATA 540 

15 

CATCACAGAA AAAAACAGAA ACAGCTCTGG GAGTCCTTAC ACAGGTCCAA GGGACGAGCT 600 

TGCAACCCAT GGCATACCTG AGTAAGGAAA CTGATGTAGT GGCAAAGGGT TGGCTTCATT 660 

20 GTTTATGGGT AGTGGTGGCA GTAGCAGTTG TAGTATCTGA AGCAGTTAAA ATAATACAGG 720 

GGAGAGATCT TACTGTGTGG ACATCTCATG AGGTGAACAG CATACTCACT GCTAAAGGAG 780 

ACTTGTGGCT GTCAGACAAC CGTTTACTTA AATATCAGGC TCTATTACTT GAAAGGCCAG 840 

25 

TGCTGCAACT GTGCACTTGT GCAACTCTTA ACCCAGTCNC ATTTCTTCCA GACAATGAAG 900 

ATAGAATATA ACTGTCAACA AAT/VATTTCT CAAACCTATG CCACTCGAGG GGACCTTCTA 960 

30 GAAGTTCCCT TGACTGATCC TGACCTTCAA CTTGTATACT GATGGAAGTT CCTTTGTAGA 1020 

AAAAGGACTT CAAAAGCGGG GTATGCAGTG GTCAGTGATA ATGGAATATT TGAAAGTATC 1080 



35 

AATTAGGAGA AGGAJVAAAGG GTAAATATAT ATACAGACTC TGAGTATGCT CACCTAGTCN 1200 



FEUILLE DE REMPLACEMENT (REGLE 26) 



8 



TCCATGCCCA TGAGGCAATA TGCAGAGAAA GGGAATTCCT AACTTCCGAG GGAACACCTA 1260 
TCACACATCA GGAAGCCATT AGGAGATTAT TACTGGCAGT ACAGPiAACCT AAAGAGGTGG 1320 

5 

AAGTCTTACA CTGCTGGGGT CATCAGAAAG GAAAGAAAAG GGAAATAGT^ GGGAATTGCC 1380 
AAGCAGATAT TGAAGCAAAA AGAGCTGCAA GGCAGGACCC TC 1422 

10 

(2) INFORMATIONS POUR LA SEQ ID NO: 4: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2006 paires de bases 
15 (B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin§aire 

(ii) TYPE DE MOLECULE: ARNm (en ADN) 

20 

(iii) HYPOTHETIQUE: NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 4: 
25 ATGCAGTGGT CAGTGATAAT GGAATACTTG AAAGTAATCC CCTCACTCCA GGAACTAGTG 60 
CTCAGCTAGC AGAACTAATA GCCCTCACTT GGGCACTAGA ATTAGGAGAA GAAAAAAG6G 120 
CAAATATATA TACAGACTCT AAATATGCTT ACCTAGTCCT CCATGCCCAT GCAGCAATAT 180 

30 

GGAAAGAAAG GGAATTCCTA ACTTCTGAGA GAACACCTAT CAAACATCAG GAAGCCATTA 240 
GGAAATTATT ATTGGCTGTA CAGAAACCTA AAGAGGTGGC AGTCTTACAC TGCCGGGGTC 300 
35 ATCANAAAGG AAAGGAAAGG GAAAATACTT TTGCCTGCAA CTATCCAATG GAAATTACTT 360 



FEUILLE DE REMPLACEMENT (REGLE 26) 




AAAACCCTTC ATCAAACCTT TCACTTAGGC 
TTATTTACTG GACCAGGCCT TTTCAAAACT 
5 TGCCAAAAAA ATAATCCCCT GCCTCATCGC 
CATTACCCTG AAAAAAACTG GCAACTGATT 
AGTATCTACT AGTCTGGGTA AATACTTTCA 
CAGAAAAGGC CCAAGAGGTA ATAAAGGCAC 
TTCCCCGAGG CTTACAGAGT GACAATAGCC 
15 TATCCCAGGC GTTAGGTATA CGATATCACT 
GGAAGGTCGA GAAAATGAAT GAAATACTCA 
CCCACCTCAC ATGGCCTGCT CTGTTGCCTA 

20 

AAAAAGCAGG ACTTAGCCCA TACGAAATGC 
TTGTGCTTGA CCCAAGACAG CCAACTTAGT 
25 ACAAGTTCTT AAAACATTAC AAGGAACCTA 
CCCTTGTGAC ATGGTATTAG TCAAGTCCCT 
CTGGGAAGGA CCCTACCCAG TCATTTTATT 

30 

G6TCTTGGAT ACATCACACT TGAGTCAAAT 
CAGGAGACAA CGCTAGCTAT TCCTGTGAAC 
35 AACAACCAGG AGGAAAGTAA CTAAAATCAT 




9 

ATGGATAGCA CCCATCAAAT GGCCT^TCA 420 
ATCAAGCAAA TATTCAGGGC CTGTGAATTG 480 
CAAGCTCCTT CAGG7UVAACA AAAAACAGGC 540 
TTACCCACAA GCCCAAACCT CAGGGATTTC 600 
CGGGTTGGGC AAAGGCCTTC CCCTGTAGGA 660 
TAGTTCATGA AATAATTCCC AGATTCGGAC 720 
CTGCTTTCCA GGCCACAGTA ACCCAGGGAG 780 
TACACTGCGC CTGAAGGCCA CAGTCCTCAG 840 
AAGGACATCT AAAAAAGCAA ACCCAGGAAA 900 
TAGCCTTAAA AAGAATCTGC AACTTTCCCC 960 
TGTATGGAAG GCCCTTCATA ACCAATGACC 1020 
TGCAGACATC ACCTCCTTAG CCAAATATCA 1080 
TCCCTGAGAA GAGGGA7VAAG AACTATTCCA 1140 
TCTCTCTAAT TCCCCATCCC TAGATACATC 1200 
TACCCCAACT GCGGTTAAAG TGGCTGGAGT 1260 
CCTGGATACT GCCAAAGGAA CCTGAAAATC 1320 
CTCTAGAGGA TTTGCGCCTG CTCTTCAAAC 1380 
AAATCCCCCA TGGCCCTCCC TTATCATATT 1440 



FEUILLE DE REMPLACEMENT (REGLE 26) 



10 

TTTCTCTTTA CTGTTCTTTT ACCCTCTTTC ACTCTCACTG CACCCCCTCC ATGCCGCTGT 1500 

ATGACCAGTA GCTCCCCTTA CCAAGAGTTT CTATGGAGAA TGCAGCGTCC CGGAAATATT 1560 

5 GATGCCCCAT CGTATAGGAG TCTTTCTAAG GGAACCCCCA CCTTCACTGC CCACACCCAT 1620 

ATGCCCCGCA ACTGCTATCA CTCTGCCACT CTTTGCATGC ATGCAAATAC TCATTATTGG 1680 

ACAGGAAAAA TGATTAATCC TAGTTGTCCT GGAGGACTTG GAGTCACTGT CTGTTGGACT 1740 

10 

TACTTCACCC AAACTGGTAT GTCTGATGGG GGTGGAGTTC AAGATCAGGC AAGAGAAAAA 1800 

CATGTAA7VAG AAGTAATCTC CCAACTCACC CGGGTACATG GCACCTCTAG CCCTACAAAG 1860 

15 GACTAGATCT CTCAAAACTA CATGAAACCC TCCGTACCCA TACTCGCCTG GTAAGCCTAT 1920 

TTAATACCAC CCTCACTGGG CTCCATGAGG TCTCGGCCCA AAACCCTACT AACTGTTGGA 1980 

TATGCCTCCC CCTGAACTTC AAGCCA 2006 

20 

(2) INFORMATIONS POUR LA SEQ ID NO: 5: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
25 (A) LONGUEUR: 1948 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin§aire 

3 0 (ii) TYPE DE MOLECULE: ARNm (en ADN) 

(iii) HYPOTHETIQUE: NON 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 5: 



35 



ACTGCACTCT TCTGGTCCAT GTTTCTTACG GCTCGAGCTG AGCTTTTGCT CACCGTCCAC 60 



FEUILLE DE REMPLACEMENT (REGLE 26) 



11 



CACTGCTGTT TGCCACCACC GCANACCTGC CGCTGACTCC CATCCCTCTG GATCCTGCAG 120 

GGTGTCCGCT GTGCTCCTGA TCCAGCGAGG CGCCCATTGC CGCTCCCAAT TGGGCTAAAG 180 

5 

GCTTGCCATT GTNCCTGCAC GGCTAAGTGC CTGGGTTTGT TCTAATTGAG CTGAACACTA 240 

NTCACTGGGT TCCATGGTTC TCTTCTGTGA CCCACGGCTT CTAATAGAAC TATAACACTT 300 

10 ACCACATGGC CCAAGATTCC ATTCCTTGGA ATCCGTGAGG GCAAGAACTC CAGGTCAGAG 360 

AATACGAGGC TTGCCACCAT CTTGGAAGCG GCCTGCTACC ATCTTGG7VAG TGGTTCACCA 420 

CCATCTTGGG AGCTCTGTGA GCAAGGACCC CCCGGTAACA TTTTGGCAAC CACGAACGGA 480 

15 

CATCCAAAGT GATACATCCT GGGAAGGACC CTACCCAGTC ATTTTATCTA CCCCAACTGC 540 

GGTTAAAGTG GCTGGAGTGG AGTCTTGGAT ACATCACACT TGAGTCAAAT CCTGGATACT 600 

20 GCCAAAGGAA CCTGAAAATC CAGGAGACAA CGCTAGCTAT TCCTGTGAAC CTCTAGAGGA 660 

TTTGCGCCTG CTCTTCAAAC AACAACCAGG AGGAAAGTAA CTAA7VATCAT AAATCCCCAT 720 

GGCCCTCCCT TATCATATTT TTCTCTTTAC TGTTGTTTCA CCCTCTTTCA CTCTCACTGC 780 

25 

ACCCCCTCCA TGCCGCTGTA TGACCAGTAG CTCCCCTTAC CAAGAGTTTC TATGGAGAAT 840 

GCAGCGTCCC GGAAATATTG ATGCCCCATC GTATAGGAGT CTTTGTAAGG GAACCCCCAC 900 

30 CTTCACTGCC CACACCCATA TGCCCCGCAA CTGCTATCAC TCTGCCACTC TTTGCATGCA 960 

TGCAAATACT CATTATTGGA CAGGAAAAAT GATTAATCCT AGTTGTCCTG GAGGACTTGG 1020 

AGTCACTGTC TGTTGGACTT ACTTCACCCA AACTGGTATG TCTGATGGGG GTGGAGTTCA 1080 

35 

AGATCAGGCA AGAGAAAAAC ATGT7VAAAGA AGTAATCTCC CAACTCACCC GGGTACATGG 1140 

FEUILLE DE REMPLACEMENT (REGLE 26) 




12 




CACCTCTAGC CCCTACAAAG GACTAGATCT CTCAAAACTA CATGAAACCC TCCGTACCCA 1200 

TACTCGCCTG GTAAGCCTAT TTAATACCAC CCTCACTGGG CTCCATGAGG TCTCGGCCCA 1260 

5 

AAACCCTACT AACTGTTGGA TATGCCTCCC CCTGAACTTC AGGCCATATG TTTCAATCCC 1320 

TGTACCTGAA CAATGGAACA ACTTCAGCAC AGAAATTUU^C ACCACTTCCG TTTTAGTAGG 1380 

10 ACCTCTTGTT TCCAATCTGG AAATAACCCA TACCTCA7VAC CTCACCTGTG TAAAATTTAG 1440 

CAATACTACA TACACAACCA ACTCCCAATG CATCAGGTGG GTAACTCCTC CCACACAAAT 1500 

AGTCTGCCTA CCCTCAGGAA TATTTTTTGT CTGTGGTACC TCAGCCTATC GTTGTTTGAA 1560 

15 

TGGCTCTTCA GAATCTATGT GCTTCCTCTC ATTCTTAGTG CCCCCTATGG CCATCTACAC 1620 

TGAACAAGAT TTATACAGTT ATGTCATATC TAAGCCCCGC AACAAAAGAG TACCCATTCT 1680 

2 0 TCCTTTTGTT ATAGGAGCAG GAGTGCTAGG TGCACTAGGT ACTGGCATTG GCGGTATCAC 1 7 4 0 

AACCTCTACT CAGTTCTACT ACAAACTATC TCAAGAACTA AATGGGGACA TGGAACGGGT 1800 

CGCCGACTCC CTGGTCACCT TGCAAGATCA ACTTAACTCC CTAGCAGCAG TAGTCCTTCA 1860 

25 

AAATCGAAGA GCTTTAGACT TGCTAACCGC TGAAAGAGGG GGAACCTGTT TATTTTTAGG 1920 

GGAAGAATGC TGTTATTATG TTAATCAA 1948 



30 



(2) INFORMATIONS POUR 



LA SEQ ID NO: 6: 



(i) CARACTERISTIQUES DE LA SEQUENCE: 



(A) LONGUEUR: 1136 paires de bases 



35 



(B) TYPE: nucleotide 



(C) NOMBRK DE BRINS: simple 



FEUILLE DE REMPLACEMENT (REGLE 26) 



# 



/nj CONFIGURATION? lin#alre 



(ii) TYPE DE MOLECULE: ARNm (en ADN) 



5 



(iii) HYPOTHETIQUE: NON 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 6: 
CCATGGCCAT CTACACTGAA CAAGATTTAT ACAGTTATGT CATATCTAAG CCCCGCAACA 



AAAGAGTACC CATTCTTCCT TTTGTTATAG GAGCAGGAGT GCTAGGTGCA CTAGGTACTG 
GCATTGGCGG TATCACAACC TCTACTCAGT TCTACTACAA ACTATCTCAA GAACTAAATG 
15 GGGACATGGA ACGGGTCGCC GACTCCCTGG TCACCTTGCA AGATCAACTT AACTCCCTAG 
CAGCAGTAGT CCTTCAAAAT CGAAGAGCTT TAGACTCGCT AACCGCTGAA AGAGGGGGAA 
CCTGTTTATT TTTAGGGGAA GAATGCTGTT ATTATGTTAA TCAATCCGGA ATCGTCACTG 



AGAAAGTTAA AGAAATTCGA GATCGAATAC AACGTAGAGC AGAAGAGCTT CGAAACACTG 

f- - 

GACCCTGGGG CCTCCTCAGC CAATGGATGC CCTGGATTCT CCCCTTCTTA GGACCTCTAG 

25 CAGCTATAAT ATTGCTACTC CTCTTTGGAC CCTGTATCTT TAACCTCCTT GTTAACTTTG 

TCTCTTCCA6 AATCGAAGCT GTAAAACTAC AAATGGAGCC CAAGATGCAG TCCAAGACTA 

AGATCTACCG CAGACCCCTG GACCGGCCTG CTAGCCCACG ATCTGATGTT AATGACATCA 



AAGGCACCCC TCCTGAGGAA ATCTCAGCTG CACAACCTCT ACTACGCCCC AATTCAGCAG 
GAAGCAGTTA GAGCGGTCGT CGGCCAACCT CCCCAACAGC ACTTAGGTTT TCCTGTTGAG 
35 ATGGGGGACT GAGAGACAGG ACTAGCTGGA TT" . .GACT/^. AA TCCl, ..GCC 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 



FEUILLE DE REMPLACEM? 




TAGCTGGGAA GGTGACCACA TCCACCTTTA AACACGGGGC TTGCAACTTA GTTGACACCT 900 
GACCAATCAG AGAGCTCACT AAAATGCTAA TTAGGCAAAG ACAGGAGGTA AAGAAATAGC 960 
CAATCATCTA TTGCATGAGA GCACAGCAGG AGGGACAATG ATCGGGATAT AAACCCAAGT 1020 
CTTCGAGCCG GCAACGGCAA CCCCCTTTGG GTCCCCTCCC TTTGTATGGG AGCTCTGTTT 1080 
TCATGCTATT TCACTCTATT AAATCTTGCA GCTGCGAAAA AAAAAAAAAA AAAAAA 1136 

(2) INFORMATIONS POUR LA SEQ ID NO: 7: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2782 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin^aire 

(ii) TYPE DE MOLECULE: ARNm (en ADN) 
(iii) HYPOTHETIQUE: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 7 

ATGGGAGCTG TTTTCATGCT ATTTCACTCT ATTATVATCTT GCAACTGCAC TCTTCTGGTC 60 

CATGTTTCTT ACGGCTCGAG CTGAGCTTTT GCTCACCGTC CACCACTGCT GTTTGCCACC 120 

ACCGCAGACC TGCCGCTGAC TCCCATCCCT CTGGATCCTG CAGGGTGTCC GCTGTGCTCC 180 

TGATCCAGCG T^GCGCCCAT TGCCGCTCCC AATTGGGCTA AAGGCTTGCC ATTGTTCCTG 240 

. * ^w^* * * J. %jnv7wxv»nn\^/% X rtv» 1 UMU UUXTCCATGG 300 

TTCTCTTCTG TGACCCACGG CTTCTAATAG AACTATAACA CTTACCACAT GGCCCAAGAT 360 

FEUILLE DE REMPLACEMENT (REGLE 26) 




TCCATTCCTT GGAATCCGTG AGGCCAACGA ACTCCAGGTC AGAGAATACG AAGCTTGCCA 420 
CCATCTTGGA AGCGGCCTGC TACCATCTTG GAAGTGGTTC ACCACCATCT TGGGAGCTCT 480 

5 

GTGAGCAAGG ACCCCCCGGT GACATTTTGG CGACCACCAA CGGACATCCC AAGTGATACA 540 
TCCTGGGAAG GACCCTACCC AGTCATTTTA TCTACCCCAA CTGCGGTTAA AGTGGCTGGA 600 
10 GTGGAGTCTT GGATACATCA CACTTGAGTC AAATCCTGGA TACTGCCAAA GGAACCTGAA 660 
AATCCAGGAG ACAACGCTAG CTATTCCTGT GAACCTCTAG AGGATTTGCG CCTGCTCTTC 720 
AAACAACAAC CAGGAGGAAA GTAACTAAAA TCATAAATCC CCATGGGCCT CCCTTATCAT 780 

15 

ATTTTTCTCT GTAGTGTTCT TTCACCCTGT TTCACTCTCA CTGCACCCCC TCCATGCCGC 840 
TGTATGACCA GTAGCTCCCC TCACCCAGAG TTTCTATGGA GAATGCAGCG TCCCGGAAAT 900 
20 ATTGATGCCC CATCGTATAG GAGTCTTTCT AAGGGAACCC CCACCTTCAC TGCCCACACC 960 
CATATGCCCC GCAACTGCTA TCACTCTGCC ACTCTTTGCA TGCATGCAAA TACTCATTAT 1020 
TGGACAGGAA AAATGATTAA TCCTAGTTGT CCTGGAGGAC TTGGAGTCAC TGTCTGTTGG 1080 

25 

ACTTACTTCA CCCAAACTGG TATGTCTGAT GGGGGTGGAG TTCAAGATCA GGCAAGAGAA 1140 
AAACATGTAA AAGAAGTAAT CTCCCAACTC ACCGGGGTAC ATGGCACCTC TAGCCCCTAC 1200 
30 AAAGGACTAG ATCTCTCAAA ACTACATGAA ACCCTCCGTA CCCATACTCG CCTGGTAAGC 1260 
CTATTTAATA CCACCCTCAC TGGGCTCCAT GAGGTCTCGG CCCAAAACCC TACTAACTGT 1320 



35 

AACAACTTCA GCACAGAAAT AAACACCACT TCCGTTTTAG TAGGACCTCT TGTTTCCAAT 1440 

FEUILLE DE REMPLACEMENT (REGLE 26) 



16 

GTGGAAATAA CCCATACCTC AAACCTCACC TGTGTAAAAT TTAGCAATAC TACATACAC|V 1500 
ACCAACTCCC AATGCATCAG GTGGGTAACT CCTCCCACAC AAATAGTCTG CCTACCCTCA 1560 

5 

GGAATATTTT TTGTCTGTGG TACCTCAGCC TATCGTTGTT TGAATGGCTC TTCAGAATCT 1620 
ATGTGCTTCC TCTCATTCTT AGTGCCCCCT ATGACCATCT ACACTG7VACA AGATTTATAC 1680 
10 AGTTATGTCA TATCTAAGCC CCGCAACAAA AGAGTACCCA TTCTTCCTTT TGTTATAGGA 1740 
GCAGGAGTGC TAGGTGCACT AGGTACTGGC ATTGGCGGTA TCACAACCTC TACTCAGTTC 1800 
TACTACAAAC TATCTCAAGA ACTAAATGGG GACATGGAAC GGGTCGCCGA CTCCCTGGTC 1860 

15 

ACCTTGCAAG ATCAACTTAA CTCCCTAGCA GCAGTAGTCC TTCGAAATCG AAGAGCTTTA 1920 
GACTTGCTAA CCGCTGAGAG AGGGGGAACC TGTTTATTTT TAGGGGAAGA ATGCTGTTAT 1980 
2 0 TATGTTAATC AATCCGGAAT CGTCACTGAG AAAGTTGAAG AAATTCCAGA TCGTVATACAA 2040 
CGTATAGCAG AGGAGCTTCG AAACACTGGA CCCTGGGGCC TCCTCAGCCG Al'GGATGCCC 2100 
TGGATTCTCC CCTTCTTAG6 ACCTCTAGCA GCTATAATAT TGCTACTCCT CTTTGGACCC 2160 

25 

TGTATCTTTG ACCTCCTTGT TAACTTTGTC TCTTCCAGAA TCGAAGCTGT GAAACTACAA 2220 
ATGGAGCCCA AGATGCAGTC CAAGACTAAG ATCTACCGCA GACCCCTGGA CCGGCCTGCT 2280 

30 AGCCC/"^ GAT CTGATGTTA.A TGACATCAAA CCCACCCCTC CTGA : CA^CTGCA 2340 

CAACCTCTAC TA jGCCCCAA TTCAGCAGGA AGCAGTTAGA GCGGTGGTCG GCCAACCTCC 2400 



35 

TCC'i i^s.. -AGAA _^AAGCCTA GC"-C,C -\I\GG TGACCACATC CACCTT-VUIA 2520 



17 



CACGGGGCTT GCAACTTAGC TCACACCTGA CCAATCAGAG AGCTCACTAA AATGCTAATT 2580 
AGGCAAAGAC AGGAGGTAAA GAAATAGCCA ATCATTTATT GCCTGAGAGC ACAGCAGGAG 2640 

5 

GGACAATGAT CGGGATATAA ACCCAAGTTT TCGAGCCGGC AACGGCAACC CCCTTTGGGT 2700 
CCCCTCCCTT TGTATGGGAG CTCTGTTTTC ATGCTATTTC ACTCTATTAA ATCTTGCAAC 2760 
10 TGCAAAAAAA AAAAAAAAAA AA 2782 

(2) INFORMATIONS POUR LA SEQ ID NO: 8: 

15 (i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 666 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin^aire 

20 

(ii) TYPE DE MOLECULE: ARNm (en ADN) 
(iii) HYPOTHETIQUE: NON 
25 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 8: 

TGTCCGCTGT GCTCCTGATC CAGCGAGGCG CCCATTGCCG CTCCCTVATTG GGCTAAAGGC 60 



TTGCCATTGT TCCTGCACGG CTAAGTGCCT GGGTTTGTTC TAATTGAGCT GAACACTANT 120 

30 

CACTGGGTTC CATGGTTCTC TTCTGTGACC CACGGCTTCT AATATAACTA TAACACTTAC 180 



CACATGGCCC AAGATTCCAT TCCTTGGAAT CCGTGAGGCC AAGAACTCCA GGTCAGAGAA 240 



35 TACGAGGCTT GCCACCATCT TGGAAGCGGC CTGCTACCAT CTTGGAAGTG GTTCACCACC 300 



FEUILLE DE REMPLACEMENT (REGLE 26) 




18 



ATCTTGGGAG CTCTGTGAGC AAGGACCCCC CGGTAACATT TTGGCAACCA CGAACGGAGA 360 

TCCAAAGTGA ATCGAAGCTG TAAAACTACA AATGGAGCCC AAGATGCAGT CCAAGACTAA 420 

5 GATCTACCGC AGACCCCTGG ACCGGCCTGC TAGCCCACGA TCTGATGTTA ATGACATCAA 480 

AGGCACCCCT CCTGAGGAAA TCTCAGCTGC ACAACCTCTA CTACGCCCCA ATTCAGCAGG 540 

AAGCAGTTAG AGCGGTCGTC GGCCAACCTC CCCAACAGCA CTTAGGTTTT CCTGTTGAGA 600 

10 

TGGGGGACTG AGAGACAGGA CTAGCTGGAT TTCCTAGGCT GACTAAGAAT CCCTAAGCCT 660 

AGCTGG 656 

(2) INFORMATIONS POUR LA SEQ ID NO: 9: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 3372 paires de bases 
2 0 (B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 
<D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ARNm (en ADN) 

25 

(iii) HYPOTHETIQUE: NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 9: 
30 GACTTCCCAA ATACCAGAGG AAGCAGAGTG GTTTACAGTC CTGGACCTTC AGGATGCCTT 60 
CTTCTGCATC CCTGTACATC CTGACTCTCA ATTCTTGTTT GCCTTTGAAG ATACTTCAAA 120 

35 

ATTTGGCCAG GCATTAGCCC AAGACTTGAG CCAATCCTCA TACCTGGACA CTTGTCCTTC 240 



FEUILLE DE REMPLACEMENT (REGLE 26) 



m 



19 



GGTAGGTGGA TGATTTACTT TTGGCCGCCC ATTCAGAAAC CTTGTGCCAT CAAGCCACCC 300 

AAGCGCTCTT CAATTTCCTC GCTACCTGTG GCTACATGGT TTCCAAACCA AAGGCTCAAC 360 

5 

TCTGCTCACA GCAGGTTACT TAGGGCTAAA ATTATCCAAA GGCACCAGGG CCCTCAGTGA 420 

GGAACACATC CAGCCTATAC TGGCTTATCC TCATCCCAAA ACCCTAAAGC AACTAAGGGG 480 

10 ATTCCTTGGC GTAATAGGTT TCTGCCGAAA ATGGATTCCC AGGTATGGCG AAATAGCCAG 540 

GTCATTAAAT ACACTAATTA AGGAAACTCA GAAAGCCAAT ACCCATTTAG TAAGATGGAC 600 

AACTGAAGTA GAAGTGGCTT TCCAGGCCCT AACCCAAGCC CCAGTGTTAA GTTTGCCAAC 660 

15 

AGGGCAAGAC TTTTGTTCAT ATGTCACAGA AAAAACAGGA ATAGCTCTAG GAGTCCTTAC 720 

ACAGATCCGA GGGATGAGCT TGCAACCTGT GGCACACCTG ACTAAGGAAA TTGATGTA6T 780 

20 GGCAAAGGGT TGACCTCATT GTTTACGGGT AGTGGTGGCA GTAGCAGTCT TAGTATCTGA 840 

AGCAGTTAAA ATAATACAGG GAAGAGATCT TACTGTGTGG ACATCTCATG ATGTGAAT6G 900 

CATACTCACT GCTAAAGGAG ACTTGTGGCT GTCAGACAAC TGTTTACTTA AATGTCAGGC 960 

25 

TCTATTACTT GAAGGGCCAG TGCTGCGACT GTGCACTTGT GCAACTCTTA ACCCAGCCAC 1020 

ATTTCTTCCA GACAATGAAG AAAAGATAAA ACATAACTGT CAACAAGTAA TTTCTCAAAC 1080 

30 CTATGCCACT CGAGGGGACC TTTTAGAGGT TCCTTTGACT GATCCCGACC TCAACTTGTA 1140 

TACTGATGGA AGTTCCTTTG TAGAAAAAGG ACTTCGAAAA GTGGGGTATG CAGTGGTCAG 1200 

TGATAATGGA ATACTTGAAA GTAATCCCCT CACTCCAGGA ACTAGTGCTC AGCTAGCAGA 1260 

35 

ACTAATAGCC CTCACTTGGG CACTAGAATT AGGAGAAGAA AA7VAGGGCAA ATATAATACA 1320 

FEUILLE DE REMPLACEMENT (REGLE 26) 




GACTCTAAAT ATGCTTACCT AGTCCTCCAT GCCCATGCAG CAATATGGAA AGAAAGGGAA 1380 
TTCCTAACTT CTGAGAGAAC ACCTATCAAA CATCAGGAAG CCATTAGGAA ATTATTATTG 1440 

5 

GCTGTACAGA AACCTAGAGA GGTGGCAGTC TTACACTGCC GGGGTCATCA CAAAGGAAAG 1500 
GAAAGGGAAA TACAAGAGAA CTGCCAAGCA TATATTGAAG CCAAAAGAGC TGCAAGGCAG 1560 

10 GACCCTCCAT TAGAAATGCT TATTAAACTT CCCTTAGTAT AGGGTAATCC CTTCCGGGAA 1620 
ACCAAGCCCC AGTACTCAGC AGGAGAAAtA GAATGGGGAA CCTCACGAGG CAGTTTTCTC 1680 
CCCTCGGGAC GGTTAGCCAC TGAAGAAGGG AAAATACTTT TGCCTGCAAC TATCCAATGG 1740 
AAATTACTTA AAACCCTTCA TCAAACCTTT CACTTAGGCA TCGATAGCAC CCATCAGATG 1800 
GCCAAATCAT TATTTACTGG ACCAGGCCTT TTCAAAACTA TCAAGCAGAT AGTCAGGGCC 1860 

20 TGTGAAGTGT GCCAGAGAAA TAATCCCCTG CCTTATCGCC AAGCTCCTTC AGGAGAACAA 1920 
AGAACAGGCC ATTACCCTGG AGAAGACTGG CAACTGATTT TACCCACAAG CCCAAACCTC 1980 
AGGGATTTCA GTATCTACTA GTCTGGGTAG ATACTTTCAC GGGTTGGGCA GAGGCCTTCC 2040 

25 

CCTGTAGGAC AGAAAAGGCC CAAGAGGTAA TAAAGGCACT AGTTCATGAA ATAATTCCCA 2100 
GATTCGGACT TCCCCGAGGC TTACAGAGTG ACAATAGCCC TGCTTTCCAG GCCACAGTAA 2160 
30 CCCAGGGAGT ATCCCAGGCG TTAGGTATAC GATATCACTT ACACTGCGCC TGAAGGCCAC 2220 
AGTCCTCAGG GAAGGTCGAG AAAATGAATG AAACACTCAA AGGACATCTA TUUUUVGCATUV 2280 
CCCAGGAAAC CCACCTCACA TGGCCTOTTC TGTTGCCTAT AGCCTTAAAA AGA-ATCTGCA 2340 

35 

ACTTTCCCCA AAAAGCAGGA CTTAGCCCAT ACGAAATGCT GTATGGAAGG CCCTTCATAA 2400 

FEUILLE DE REMPLACEMENT (REGLE 26) 




CCAATGACCT TGTGCTTGAC CCAAGACAGC 
CAAATATCAA CAAGTTCTTA AAACATTACA 

5 

TATTCCACCC AAGTGACATG GTATTAGTCA 
ATACATCCTG GGAAGGACCC TACCCAGTCA 
10 CTGGAGTGGA GTCTTGGATA CATCACACTT 
CTGAAAATCC AGGAGACAAC GCTAGCTATT 
TCTTCAAACA ACAACCAGGA GGAAAAATCG 

15 

TGCAGTCCAA GACTAAGATC TACCGCAGAC 
ATGTTAATGA CATCAAAGGC ACCCCTCCTG 
20 GCCCCAATTC AGCAGGAAGC AGTTAGAGCG 
GGTTTTCCTG TTGAGATGGG GGACTGAGAG 
AAGAATCCCT AAGCCTAGCT GGGAAGGTGA 

25 

ACTTAGCTCA CACCTGACCA ATCAGAGAGC 
AGGTAAAGAA ATAGCCAATC ATTTATTGCC 
30 GATATAAACC CAAGTTTTCG AGCCGGCAAC 
ATGGGAGCTC TGTTTTCATG CTATTTCACT 

35 




21 . 

CAACTTAGTT GCAGACATCA CCTCCTTAGC 2460 
AGGAACCTAT CCCTGAGAAG AGG7VAAAGAA 2520 
AGTCCCTTCC CTCTAATTCC CCATCCCTAG 2580 
TTTTATCTAC CCCAACTGCG GTTAAAGTGG 2640 
GAGTCAAATC CTGGATACTG CCAAAGGAAC 2700 
CCTGTGAACC TCTAGAGGAT TTGCGCCTGC 2760 
AAGCTGTAAA ACTACAAATG GAGCCCAAGA 2820 
CCCTGGACCG GCCTGTTAGC CCACGATCTG 2880 
AGGAAATCTC AGCTGCACAA CCTCTACTAC 2940 
GTCGTCGGCC AACCTCCCCA ACAGCACTTA 3000 
ACAGGACTAG CTGGATTTCC TAGGCTGATT 3060 
CCACATCCAC CTTTAAACAC GGGGCTTGCA 3120 
TCACTAAAAT GCTAATTAGG CAAAGACAGG 3180 
TGAGAGCACA GCAGGAGGGA CAATGATCGG 3240 
GGCAACCCCC TTTGGGTCCC CTCCCTTTGT 3300 
CTATTAAATC TTGCAACTGC AAAAAAAAAA 3360 

I-* o 



FEUILLE DE REMPLACEMENT (REGLE 26) 




(2) INFORMATIONS POUR LA SEQ ID NO: 10: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2372 paires de bases 
5 (B) TYPE: nucl§otide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ARNm (en ADN) 
(iii) HYPOTHETIQUE: NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 10: 

15 ACTGCACTCT TCTGGTCCAT GTTTCTTACG GCTCGAGCTG AGCTTTTGCT CACCGTCCAC 60 

CACTGCTGTT TGCCACCACC GCAGACCTGC CGCTGACTCC CATCCCTCTG GATCCTGCAG 120 

GGTGTCCGCT GTGCTCCTGA TCCAGCGAGG CGCCCATTGC CGCTCCCAAT TGGGCTAAAG 180 

20 

GCTTGCCATT GTTCCTGCAC GGCTAAGTGC CTGGGTTTGT TCTAATTGAG CTGAACACTA 240 

ATCACTGGGT TCCATGGTTC TCTTCTGTGA CCCACGGCTT CTAATAGAAC TATAACACTT 300 

25 ACCACATGGC CCAAGATTCC ATTCCTTGGA ATCCGTGAGG CCAAGAACTC CAGGTCAGAG 360 

AATACGAGGC TTGCCACCAT CTTGGAAGCG GCCTGCTACC GTCTTGGAAG TGGTTCACCA 420 

CCATCTTGGG AGCTCTGTGA GCAAGGACCC CCCGGTAACA TTTTGGCAAC CAACGACGGA 480 

30 

CATCCAAAGT GATGGGAAAC GTTCCCCGCA AGACAAAAAC GCCCCTAAGA CGTATTCTGG 540 

AGAATTGGGA CCAATTTGAC CCTCAGACAC TAAGAAAGAA ACGACTTATA TTCTTCTGCA 600 

35 GTGCCGCCTG GCACTCCTGA GGGAAGTATA AATTATAACA CCATCTTACA GCTAGACCTC 660 



FEUILLE DE REMPLACEMENT (REGLE 26) 




TTTTGTAGAA AAGGCAAATG GAGTGAAGTG CCATAAGTAC AAACTTTCTT TTCATTAAGA 720 
GACAACTCAC AATTATGTAA AAAGTGTGAT TTATGCCCTA CAGGAAGCCT TCAGAGTCTA 780 
5 CCTCCCTATC CCAGCATCCC CGACTCCTTC CCCAACTAAT AAGGACCCCC CTTCAACCCA 840 
AATGGTCCAA AAGGAGATAG ACAAAA6GGT AAACAGTGAA CCAAAGAGTG CCAATATTCC 900 
CCAATTATGA CCCCTCCAAG CAGTGGGAGG AAGAGAATTC GGCCCAGCCA GAGTGCATGT 960 
GCCTTTTTCT CTCCCAGACT TAAAGCAAAT AAAAACAGAC TTAGGTAAAT TCTCAGATAA 1020 
CCCTGATGGC TATATTGATG TTTTACAAGG GTTAGGACAA TTCTTTGATC TGACATGGAG 1080 
15 AGATATAATG TCACTGCTAA ATCAGACACT- AACCCCAAAT GAGAGAAGTG CCACCATAAC 1140 
TGCAGCCTGA GGGTTTGGCG TCTCTGGTAT CTCAGTCAGG TCAATGGATA NGGATGACAA 1200 
CAGAAGGAAA GANAATGATT CCCCACAGGC CAGCAGGCAG TTCCCAGTCT AGACCCTCAT 1260 

20 

TGGGACACAG AATCAGAACA TGGAGATTGG TGCTGCAGAC ATTTGCTAAC TTGTGTGCTA 1320 
GAAGGACTAA GGAAAACTAG GAAGAAGTCT ATGAATTACT CAATbATGTC CACCATAACA 1380 
25 CAGGGAAGGG AAGAAAATCC TACTGCCTTT CTGGAGAGAC TAAGGGAGGC ATTGAGGT^G 1440 
CGTGCCTCTC TGTCACCTGA CTCTTCTGAA GGCCAACTTW^ TCTTAAAGCG TAAGTTTATC 1500 
ACTCAGTCAG CTGCAGACAT TAGAAAAAAC TTCAAAAGTC TGCCGTAGGC CCGGAGCAAA 1560 

30 

ACTTAGAAAC CCTATTGAAC TTGGCAACCT CGGTTTTTTA TAATAGAGAT CAGGAGGAGC 1620 
AGGCGGAACA GGACAAACGG GATTAAAAAA AAGGCCACCG CTTTAGTCAT GACCCTCAGG 1680 
35 CAAGTGGACT TTGGAGGCTC TGGAAAAGGG AAAAGCTGGG CAAATTGAAT GCCTAATAGG 1740 

FEUILLE DE REMPLACEMENT (REGLE 26) 



GCTTGCTTCC AGTGCGGTCT ACAAGGACAC TTTAAAAAAG ATTGTCCAAG TAGAAGTAAG 1800 
CCGCCCCTTC GTCCATGCCC CTTATTTCAA GGGAATCACT GGAAGGCCCA CTGCCCCAGG 1860 
GGACAAAGGT CTTTTGAGTC AGAAGCCACT AACCAGATGA TCCAGCAGCA GGACTGAGGG 1920 
TGCCTGGGGC AAGCGCCATC CCATGCCATC ACCCTCACAG AGCCCTGGGT ATGCTTGACC 1980 
ATTGAGGGCC AGGAAGGTTG TCTCCTGGAC ACTGGTGCGG TCTTCTTAGT CTTACTCTTC 2040 
TGTCCCGGAC AACTGTCCTC CAGATCTGTC ACTATTCTGA GGGGGTCCNT AAGACGGGCA 2100 
GTCACTAGAT ACTTTTTCCC AGCCACTAAG TTATGAACTG GGGAGCTTTA TTCTTTTCAC 2160 
ATGCTTTTCT AATTATGCTT GAAAGCCCCA CTACCTTGTT AGGGAGAGAC ATTCTAGCAA 2220 
AAGCAGGGGC CATTATACAC CTGAACATAG GAGAAGGAAC ACCCGTTTGT TGTNCCCCTG 2280 
CTTGAGGAAG GAATTAATCC TGAAGTCTGG GCAACAGAAG GACAATATGG ACGAGCCAAA 2340 
GAATGCCCGT CCTGTTCAAG TTAAACTAAA GG 2372 

(2) INFORMATIONS POUR LA SEQ ID NO: 11: 

(i) CARACTERISTIQUES DE LA SEQUENCE; 

(A) LONGUEUR: 7582 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE OE BRINS: simple 

(D) CONFIGURATION: lin^aire 

(ii) TYPE DE MOLECULE: ARNm (en ADN) 

(x:.; aEScRIP"xON ..a S-iQUEN^ . l, ^ ID NO: 11: 



25 



CAACAATCGG GATATAAACC CAGGCATTCG AGCTGGCAAC AGCAGCCCCC CTTTGGGTCC 60 
CTTCCCTTTG TATGGGAGCT GTTTTCATGC TATTTCACTC TATTAAATCT TGCAACTGCA 120 
CTCTTCTGGT CCATGTTTCT TACGGCTCGA GCTGAGCTTT TGCTCACCGT CCACCACTGC 180 
TGTTTGCCAC CACCGCANAC CTGCCGCTGA CTCCCATCCC TCTGGATCCT GCAGGGTGTC 240 
CGCrGTGCTC CTGATCCAGC GARGCGCCCA TTGCCGCTCC CAATTGGGCT AAAGGCTTGC 300 
CATTGTNCCT GCACGGCTAA GTGCCTGGGT TTGTTCTAAT TGAGCTGAAC ACTANTCACT 360 
GGGTTCCATG GTTCTCTTCT GTGACCCACG GCTTCTAATA KAACTATAAC ACTTACCACA 420 
TGGCCCAAGA TTCCATTCCT TGGAATCCGT GAGGSCAACG AACTCCAGGT CAGAGAATAC 480 
GARGCTTGCC ACCATCTTGG AAGCGGCCTG CTACCRTCTT GGAAGTGGTT CACCACCATC. 540 
TTGGGAGCTC TGTGAGCAAG GACCCCCCGG TRACATTTTG GCRACCAMSR ACGGACATCC 600 
M/U^GTGATGG GAAACGTTCC CCGCAAGACA AAAACGCCCC TAAGACGTAT TCTGGARAAT 660 
TGGGAMCAAT TTGACCCTCA GACACTAAGA AAGAAACGAC TTATATTCTT CTGCAGTGCC 720 
GCCTGGCACT CCTGAGGGAA GTATAAATTA TAACACCATC TTACAGCTAG ACYTCTTTTG 780 
TAGAAAAGGC AAATGGAGTG AAGTGCCATA AGTACAAACT TTCTTTTCAT TAAGAGACAA 840 
CTCACAATTA TGTAAAAAGT GTGATTTATG CCCTACAGGA AGCCTTCAGA GTCTACCTCC 900 
CTATCCCAGC ATCCCCGACT CCTTCCCCAM YTAATAAGGA CCCCCCTTCA ACCCAAATGG 960 
TCCAAAAGGA GATAGACAAA AGGGTAAACA GTGAACCAAA GAGTGCCAAT ATTCCCCAAT 1020 
TATGACCCCT CCCAAGCAGT GGGAGGAAGA GAATTCGGCC CAGCCAGAGT GCATGTGCYT 1080 
TTTyyTCTCC CAGACTTAAA GCAAATAAAA ACAGACTTAG GTTU^TTCTC AGATAAYCCT 1140 
GATGGCTATA TTGRTGTTTT ACAAGGGTTA GGACAATTCT TTGATCTGAC ATGGAGAGAT 1200 
ATATATGTCA CTGCTAAATC AGACACTAAC CCCAAATGAG AGAAGTGCCA CCATAACTGC 1260 
AGCCTGAGRG TTTGGCGATC TCTGGTATCT CAGTCAGGTC AATGGATANG GATGACAACA 1320 
GAAGGAAAGA NAATGATTCC CCACAGGCCA GCARGCAGTT CCCAGTCTAS ACCCTCATTG 1380 
GGGACACAGA AATCAGTAAC ATGGGAGATT GGTGCTGCAG ACATTTGCTA ACTTGTGTGC 1440 
TASAAGGACT AAGGAAAACT ASGAAGAAAR TCTAYGAATT ACTCAATGAT GTCCACCATA 1500 
ACACAGGGGA AGGGAAGAAA ATCCTACTGC CTTTCTGGAG AGACTAAGGG AGGCATTGAG 1560 
GAAGCGTGCC TCTCTGTCAC CTGACTCTTC TGAAGGCCAA CTAATCTTAA AGCGTAAGTT 1620 
TATCACTCAG TCAGCTGCAG ACATTAGAAA AAACTTCAAA AGTCTGCCGT AGGCCCGGAG 1680 
CAAAACTTAG AAACCCTATT GAACTTGGCA ACYTCGGTTT TTTATAATAG AGATCAGGAG 1740 
GAGCAGGCGG AACAGGACAA ACGGGATTAA AAAAAAGGCC ACCGCTTTAG TCATGACCCT 1800 
CAGGCAAGTG GACTTTGGAG GCTCTGGAAA AGGGAAAAGC TGGGCAAATT GAATGCCTAA 1860 
TAGGGCTTGC TTCCAGTGCG GTCTACAAGG ACACTTTAAA AAAGATTGTC C7VAGTAGAAG 1920 
TAAGCCGCCC CTTCGTCCAT GCCCCTTATT TPARrr - ~-r.r ^t^^^^^ , r.«^ 

J.70U 

CAGGGGACAA AGGTCTTTTG AGTCAGA^^ " — ^x^A. h^^. ,CTG 2040 

AGGGTGCCTG GGGCAAGCGC CATCC JCC" ;AG; ..cr^^^ GGGTATGCTT 2100 
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GACCATTGAG GGCCAGGAAG GTTGTCTCCT 
CTTCTGTCCC GGACAACTGT CCTCCAGATC 
GGCAGTCACT AGATACTTTY TCCCAGCCAC 
TCACATGCTT TTCTAATTAT GCTTGAAAGC 
5 GCAAAAGCAG GGGCCATTAT ACACCTGAAC 
CCTGCTTGAG GAAGGAATTA ATCCTGAAGT 
CAAAGAATGC CCGTCCTGTT CAAGTTAAAC 
GGCAGTACCC CCTCAGACCC AAGGCCCAAC 
AAGCCCAAGG CTTAGTAAAA CCATGCATAA 

10 GAGGCACAGA AACCCAGTGG ACAGTGGAGG 
AGGCCGTTGT CCTTTTATAC CCAGCTGTAC 
CAGAGGAAGC AGAGTGGTTT ACASTCCTGG 
TACATCCTGA CTCTCAATTC TTGTTTGCCT 
TCACCTGGAC TRTTTTACCC CAAGGGTTCA 

15 TAGCCCAAGA CTTGAGYCAR TYMTCATACC 
ATTTACTTTT RGCYGCCYRT TCAGAAACCT 
ATTTCCTCGC YACCTGTGGC TACAWGGTTT 
AGGTTAAATA CTTAGGRCTA ARATTATCCA 
TCCAGCCTAT ACTGGCTTAT CCTCATCYCA 

20 GCRTAAYAGG YTTCTGCCGA AWATGGATTC 
WATACASTAA TTAAGGAAAC TCAGAAAGCC 
GYMRAAGTGG CTTTCCAGGC CCCTAAAGAA 
TGCCAACRGG GCAAGACTTT TSTTYATAYR 
GTCCTTACAC AGRTCCRAGG GAYGA6CTTG 

25 GATGTAGTGG CAAAGGGTTG RCYTCATTGT 
GTATCTGAAG CAGTTAAAAT AATACAGGGR 
GTGAAYRGCA TACTCACTGC TAAAGGAGAC 
TRTCAGGCTC TATTACTTGA ARGGCCAGTG 
CCAGYCNCAT TTCTTCCAGA CT^TGAAGAA 

30 TCTCA7UVCCT ATGCCACTCG AGGGGACCTT 
CAACTTGTAT ACTGATGGAA GTTCCTTTGT 
AGTGGTCAGT GATAATGGAA TAYTTGAAAG 
GCTRGCAGAA CTAATAGCCY TCAYTKGGGC 
TATATATACA GACTCTRART ATGCTVACCT 

35 AGAAAGGGAA TTCCTAACTT CYGAGR. 

ATTATTAYT6 GCWGTACAGA AACCTARAf 



GGACACTGGT 


GCGGTCTTCT 


TAGTCTTACT 


2160 


TGTCACTATT 


CTGAGGGGGT 


CCNTAAGACG 


2220 


TAAGTTATGA 


ACTGGGGAGC 


TTTATTCTTT 


2280 


CCCACTACCT 


TGTTAGGGAG 


AGACATTCTA 


2340 


ATAGGAGAAG 


GAACACCCGT 


TTGTTGTNCC 


2400 


CTGGGCAACA 


GAAGGACAAT 


ATGGACGAGC 


2460 


TAAAGGATTC 


CACTTCCTTT 


CCCTACCAAA 


2520 


AAGGATTCCA 


AAAGATTGTT 


AAGGACTTAA 


2580 


CTCCCTGCAG 


TAATTCCGTA 


GTGGATTGAG 


2640 


GTTAGTGCAA 


GATCTCAGGA 


TTATCAATGG 


2700 


CTAGCCCTTA 


TACTGTGMYT 


TCCCAAATAC 


2760 


ACCTTMAGGA 


TGCCTTCTTC 


TGCATCCCTG 


2820 


TTGAAGATAC 


TTCAAACCCA 


RCATCTCAAC 


2880 


GGGATAGYCC 


CCATCTATTT 


GGCCAGGCAT 


2940 


TGGACACTCT 


TGTCCTTCRG 


TAKGTGGATG 


3000 


TGTGCCATCA 


AGCCACCCAA 


GCRCTCTTMA 


3060 


CCAAACSARA 


RGCTCARCTC 


TGCTCACAGC 


3120 


AAGGCACCAR 


GGCCCTCAGT 


GAGGAAYRYA 


3180 


AAACCCTAAA 


GCAACTAAGR 


GRRTTCCTTC 


3240 


CCCAGGTWTG 


GCRAAATAGC 


CAGGYCATTA 


3300 


AATACCCATT 


TARTAAGATG 


GAYAMCTGAA 


3360 


GGCCTTAAAC 


CCAAGYCCCA 


GTGTTAAGYT 


3420 


TCACAGAAAA 


AAACAGRAAY 


AGCTCTRGGA 


3480 


CAACCYRTGG 


CRYACCTGAS 


TAAGGAAAYT 


3540 


TTAYGGGTAG 


TGGTGGCAGT 


AGCAGTYKTA 


3600 


AGAGATCTTA 


CTGTGTGGAC 


ATCTCATGAK 


3660 


TTGTGGCTGT 


CAGACAACYG 


TTTACTTAAA 


3720 


CTGCRACTGT 


GCACTTGTGC 


AACTCTTAAC 


3780 


AAGATARAAY 


ATAACTGTCA 


ACAARTAATT 


3840 


YTAGARGTTC 


CYTTGACTGA 


TCCYGACCTT 




AGAAAAAGGA 


CTTCGAAAAG 


YGGGGTATGC 


3960 


TAATCCCCTC 


ACTCCAGGAA 


CTAGTGCTYA, 


4020 


ACTAGAATTA 


GGAGAAGRAA 


AAAGGGYAAA 


4080 








4J.4U 






JGAR 


4200 


... .aGTC 


TT^' :,iCT 


C . JGTCATCA 


4260 
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NAAAGGAAAG RAAAGGGAAA TASAAGRGAA 
TGCAAGGCAG GACCCTCCAT TAGAAATGCT 
CTTCCGGGAA ACCAAGCCCC AGTACTCAGC 
CAGTTTTCTC CCCTCGGGAC GGTTAGCCAC 
5 TATCCAATGG AAATTACTTA AAACCCTTCA 
CCATCARATG GCCAAATCAT TATTTACTGG 
AKTCAGGGCC TGTGAAKTGT GCCARARAAA 
AGGARAACAA ARAACAGGCC ATTACCCTGR 
CCCAAACCTC AGGGATTTCA GTATCTACTA 
10 RAGGCCTTCC CCTGTAGGAC AGAAAAGGCC 
ATAATTCCCA GATTCGGACT TCCCCGAGGC 
GCCACAGTAA CCCAGGGAGT ATCCCAGGCG 
TGAAGGCCAC AGTCCTCAGG GAAGGTCGAG 
AAAAAGCAT^ CCCAGGAAAC CCACCTCACA 
15 AGAATCTGCA ACTTTCCCCA AAAAGCAGGA 
CCCTTCATAA CCAATGACCT TGTGCTTGAC 
CCTCCTTAGC CAAATATCAA CAAGTTCTTA 
AGGGAAAAGA ACTATTCCAC CCWWGTGACA 
CCCCATCCCT AGATACATCC TGGGAAGGAC 
20 CGGTTAAAGT GGCTGGAGTG GAGTCTTGGA 
TGCCAAAGGA ACCTGAAAAT CCAGGAGACA 
ATTTGCGCCT GCTCTTCAAA CAACAACCAG 
ATGGSCCTCC CTTATCATAT TTTTCTCTKT 
GCACCCCCTC CATGCCGCTG TATGACCAGT 
25 ATGCAGCGTC CCGGAAATAT TGATGCCCCA 
ACCTTCACTG CCCACACCCA TATGCCCCGC 
CATGCATU^TA CTCATTATTG GACAGGAAAA 
GGAGTCACTG TCTGTTGGAC TTACTTCACC 
CAAGATCAGG CAAGAGAAAA ACATGTAAAA 
30 GGCACCTCTA GCCCCTACAA AGGACTAGAT 
CATACTCGCC TGGTAAGCCT ATTTAATACC 
CAAAACCCTA CTAACTGTTG GATATGCCTC 
CCTGTACCTG AACAATGGAA CAACTTCAGC 
GGACCTCTTG TTTCCAATST GGAAATAACC 
35 AGCAATACTA CATACACAAC CAACTCCCAA 
ATAGTCTGCC TACCCTCAGG AATATTTTTT 




YTGCCAAGCA KATATTGAAG CMAAAAGAGC 4320 
TATTAAACTT CCCTTAGTAT AGGGTAATCC 4380 
AGGAGAAACA GAATGGGGAA CCTCACGAGG 4440 
TGAAGAAGGG AAAATACTTT TGCCTGCAAC 4500 
TCAAACCTTT CACTTAGGCA TCGATAGCAC 4560 
ACCAGGCCTT TTCAAAACTA TCAAGCARAT 4620 
TAATCCCCTG CCTYATCGCC AAGCTCCTTC 4680 
ARAARACTGG CAACTGATTT TACCCACAAG 4740 
GTCTGGGTAR ATACTTTCAC GGGTTGGGCA 4800 
CAAGAGGTAA TAAAGGCACT AGTTCATGAA 4860 
TTACAGAGTG ACAATAGCCC TGCTTTCCAG 4920 
TTAGGTATAC GATATCACTT ACACTGCGCC 4980 
AAAATGAATG AAAYACTCAA AGGACATCTA 5040 
TGGCCTGYTC TGTTGCCTAT AGCCTTAAAA 5100 
CTTAGCCCAT ACGAAATGCT GTATGGAAGG 5160 
CCAAGACAGC CAACTTAGTT GCAGACATCA 5220 
AAACATTACA AGGAACCTAT CCCTGAGAAG 5280 
TGGTATTAGT CAAGTCCCTT CYCTCTAATT 5340 
CCTACCCAGT CATTTTATYT ACCCCAACTG 5400 
TACATCACAC TTGAGTCAAA TCCTGGATAC 5460 
ACGCTAGCTA TTCCTGTGAA CCTCTAGAGG 5520 
GAGGAAAGTA ACTAAAATCA TAAATCCCCC 5580 
ASTGTTSTTT YACCCTSTTT CACTCTCACT 5640 
AGCTCCCCTY ACCMAGAGTT TCTATGGAGA 5700 
TCGTATAGGAG TCTTTST7VAG GGAACCCCC 5760 
AACTGCTATC ACTCTGCCAC TCTTTGCATG 5820 
ATGATTAATC CTAGTTGTCC TGGAGGACTT 5880 
CAAACTGGTA TGTCTGATGG GGGTGGAGTT 5940 
GAAGTAATCT CCCAACTCAC CSGGGTACAT 6000 
CTCTCAAAAC TACATGAAAC CCTCCGTACC 6060 
ACCCTCACTG GGCTCCATGA GGTCTCGGCC 6120 
CCCCTGAACT TCARGCCATA TGTTTCAATC 6180 
ACAGAAATAA ACACCACTTC CGTTTTAGTA 6240 
CATACCTCAA ACCTCACCTG TGTAAAATTT 6300 
TGCATCAGGT GGGTAACTCC TCCCACACAA 6360 
GTCTGTGGTA CCTCAGCCTA TCGTTGTTTG 6420 
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AATGGCTCTT CAGAATCTAT GTGCTTCCTC TCATTCTTAG TGCCCCCVAT GRCCATCTAC 6480 
ACTGAACAAG ATTTATACAG TTATGTCATA TCTAAGCCCC GCAACAAAAG AGTACCCATT 6540 
CTTCCTTTTG TTATAGGAGC AGGAGTGCTA GGTGCACTAG GTACTGGCAT TGGCGGTATC 6600 
ACAACCTCTA CTCAGTTCTA CTACAAACTA TCTCAAGAAC TAAATGGGGA CATGGAACGG 6660 
GTCGCCGACT CCCTGGTCAC CTTGCAAGAT CAACTTAACT CCCTAGCAGC AGTAGTCCTT 6720 
CRAAATCGAA GAGCTTTAGA CTYGCTAACC GCTGARAGAG GGGGAACCTG TTTATTTTTA 6780 
GGGGAAGAAT GCTGTTATTA TGTTAATCAA TCCGGAATCG TCACTGAGAA AGTTRAAGAA 6840 
ATTCSAGATC GAATACAACG TAKAGCAGAR GAGCTTCGAA ACACTGGACC CTGGGGCCTC 6900 
CTCAGCCRAT GGATGCCCTG GATTCTCCCC TTCTTAGGAC CTCTAGCAGC TATAATATTG 6960 
CTACTCCTCT TTGGACCCTG TATCTTTRAC CTCCTTGTTA ACTTTGTCTC TTCCAGAATC 7020 
GAAGCTGTRA AACTACAAAT GGAGCCCAAG ATGCAGTCCA AGACTAAGAT CTACCGCAGA 7080 
CCCCTGGACC GGCCTGYTAG CCCACGATCT GATGTTAATG ACATCAAAGG CACCCCTCCT 7140 
GAGGAAATCT CAGCTGCACA ACCTCTACTA CGCCCCAATT CAGCAGGAAG CAGTTAGAGC 7200 
GGTSGTCGGC CAACCTCCCC AACAGCACTT AGGTTTTCCT GTTGAGATGG GGGACTGAGA 7260 
GACAGGACTA GCTGGATTTC CTAGGCTGAY TAAGAATCCY TAAGCCTAGS TGGGAAGGTG 7320 
ACCACATCCA CCTTTAAACA CGGGGCTTGC AACTTAGYTC ACACCTGACC AATCAGAGAG 7380 
CTCACTAAAA TGCTAATTAG GCAAAGACAG GAGGTAAAGA AATAGCCAAT CATYTATTGC 7440 
MTGAGAGCAC AGCAGGAGGG ACAATGATCG GGATATAAAC CCAAGTYTTC GAGCCGGCAA 7500 
CGGCAACCCC CTTTGGGTCC CCTCCCTTTG TATGGGAGCT CTGTTTTCAT GCTATTTCAC 7560 
TCTATTAAAT CTTGCARCTG CR 1SB2 



(2) INFORMATIONS POUR LA SEQ ID NO: 12: 

(i) CARACTERXSTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2563 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin^aire 

(ii) TYPE DE MOLECULE: ADN 
(iii) HYPOTHETIQUE: NON 
(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 12: 
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ACTGCACTCT TCTGGTCCAT GTTTGTTACG GCTCGAGCTG AGCTTTTGCT CGCCATCCAC 60 
CACTGCTGTT TGCCACCGTT GCAGACCCAC TGCTGACTTC CATCCCTCTG GATCTGGCAG 120 
GGTGTCTGCT GTGCTCCTGA TCCAGCGAGG GGCCCATTGC CACTCCCAAT CGGGCTAAAG 180 
GCTTGCCATT GTTCCTGCAT GGCTAAGTGC CCAGGTTCAT CCTAATTGAG CTGAACACTA 240 
GTCACTGGGT TCCACAGTTC TCTTCCATGA ACCACGGCTT TTAATAGAGC TATAACACTC 300 
ATCGCAAGGC CCAAGATTCC ATTGCTTGGA ATCTGTGAGG CCAAGAACCC TAGGTCAGAG 360 
AACACGAGGC TTGCCACCAT CTTGGAAGCA GCCTGCCACC ATCTGGGAAG CGGCCTGCCA 420 
CCATCTTGGA AGCCGCCCGC CACCATCTTG GGAGCTCTGG GAGCAAGGAC CTCCCCGCAA 480 
CCCAGTAACA TTTAGCGACC ACGAAGGGAC CTCCAAAGCG GTAATATTGG ACCACTTTCA 540 
CTTGCTATTC TGTCCTATCC TTCCTTAGAA TTGGAGGAAA ATACCGGACA CCTGTCGGCC 600 
GGTTAAAAAC GATTAGCGTG GCCTCCGGAC TTAAGAATCA GGTGTGAGGC TATCTGGGGA 660 
AGGGCTTTCT AACAACCCCC T^CCRTTCTG GGTTGGGAAT GTTGGTCTGC CTGGAGCCAG 720 
CTTCCACTTT CAATTTTCCT GGGGAAGCCA AGGGCCGACT AGAGGCAGAA AGCTGTTGTC 780 
CCAAATTCCC GGCAGTAGCC GGTTGAGATC ATGGCGCAGC CAGAAGTCTT TACTCCACAG 840 
TCACCCATGC ATGCGCCCCT ATCTTTCCTT CTGACCCATA CCTCCTGGGT CCTAACCATG 900 
ACTTTCTTAA T^GGGTAGCC CCAAAATTCT CCTTACCTCT GAATCTACTT CCTCTGATCC 960 
CTGCCTCCTA GGTGCTAATG GTTCAGACTT TCATTTCCTC TAGCAAGTTG TATYTCCAAA 1020 
GGGATATAAG GAAGCTCTAC ACTGTATCCT TAGGCATCTA GGCTCTAAAC CCAGGGAGTC 1080 
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30 

TTGTCCCTGA TGTCCCAACC GATTTAGGTA TATAGTTCTC GACATGGGCA G' 
ACCCATTCCC CACCACCCTT GCCAGGGCCC CAAGTTTGTA AATGGCTAAG AGAGGAAAGT 1200 
5 GAGAGAGAGA GAGACAGAGT GAGACACAGA GAGAGGGAGA GACAGAGAGA GAGACAGAGA 1260 
GGAGAGAGAC ACAGAGAGGG GAGAGACACA GAGAGGAGAA GGGGGCAGAG A6ACCAAGAG 1320 
GGAGTCYMAG AGAGAGAGAA AGAAGAAGAA ATAGTAGAAA AAAAAGTGTG CCCTATTCCT 1380 

10 

TTAAAAGCCA GGGTAAATTT AAAAAACCTA TACTTGATAA TTGAAGGTCT TCTCCATGAC 1440 
CCTGTAACAC TCTAATACTA CCTTGTTCTC AGTGTAAACA AGGGTGTTAG CCTGAAAACA 1500 
15 CTGAGACCGC TGACACCCAT AGCTTTCCTA TAAAAAATCC TTAACCCAGT AACCCGCAGA 1560 
TGGCCCGCAT GCATTCAATC TGTAGTGGCA ACTGCTTTGC TAACAAGAAT AMVGTGGAAA 1620 
AGTAACTTTT AGAGGAAACC TCATTGTGAG CACACCTCAC CAGTTCAGAA TTATTCTAAG 1680 

20 

TCAAAAAAGC AAAAAGGTAG CTTACTAACT CAAAAATCTT AAAGTATGGG GTTATTTTGT 1740 
TAGAAAAAGG TAATTTAACA CTAATCACTG ATAATTCCCT TAACCCAGAA GATTTCCTAA 1800 
25 CAGGAGATTT AAATCTTAAT TACCATACAA AGGTCTGACC AGACCTAGGA GGAACTCCCT 1860 
TCAGTACAGG ATGATAGATG GTTCCTCCCA GGTGAATGAA AAAAAAATCA CAATGGGTAT 1920 
TCAGTAATTG ATAGGGAGAC TCTTGTGGAA GCAGAGTTAG AAAAACTGCC TAATAATTGG 1980 

30 

TCTCCCCAAA CCTGCGAGCT GTTTGCACTC AGCCAAGCCT TAAAGTi ,TCAA 2040 

AAAGATTATC TCAATCCTGA CTCAAAAGGT TACCTACACC CTCTGTGAAA CGAATTTACT 2100 
35 TAAGAACTGT TTATGGGACT GCATCTTGAT GGGGCAGCTG GUi.^^^...^ , ..„rCAG 2160 
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31 

GAATGCAGCC TAGCTCTAGG ACTCACCCCT GAGCACAAAG GCAATGTTGG GCATGCTGGrT 2220 
AAAGGACCAC TAGAATCCAG CAGTCCGAAC CCTTTCTTTG GGTTAAGAAA GGCGGGAAAA 2280 
5 CAGGCGCAGG ACTGCTACAT TGGTAAGCGT AACTAATCCA ATAAGCAGAG GTCCATGGGT 2340 
GGTGACACAC TCTGGAAAGG AATAAGCATT AGRACCATAG AGGACGCTCT ACGACTAATG 2400 
CTCGTCGGAA AATGACTAGA GGTGCTGGCA TCCCTATGTT CTTTTTTCAG ATGGGAAATQ 2460 
TTCCCCCTCA AGGCAAAAAC ACCCCTAAGA TGTATTCTGG ACAATTGGGA CCAATTTGAC 2 520 
CCTCAGACTC TAAGAAAGAA ACGACTTATA TTCTTCTGCA GTG 2 563 



15 



25 



(2) INFORMATIONS POUR LA SEQ ID NO: 13: 



(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2585 paires de bases 
20 (B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin^aire 



(ii) TYPE DE MOLECULE: ADN 
(iii) HYPOTHETIQUE: NON 
(xi) DE:: \M DE LA SEQUENCE: SEQ 0 NO: 13: 

30 TCAGGGATAG CCCCCATCTA : GCCA CA -^hC. CAT 60 

ACTTGGACAC TGTCCTT TGGTA. ..TGG ATGATCTACT TTTAGCCACC TGTTCAGAAA 120 



CCTTGTGCCA TCAAG- CAAGTGCTC^ T"?* 



^GG 180 



35 

TTTCCAAACC AGAGGCT . iaC A^ AGGirA' -Zi: ^firOQ CT^iVAAA^TAT 240 



32 



CCAAAGGCAC CAGGGCCCTC AGTGAGGAAC GTATCCAGCC TATACTGGCT TATCCTCATC 300 
CCAAAACCCT GAAGCAATTA AGAGGGTTCC TTGGCATAAA AGGCTGCTGT TGAATATGGA 360 

5 

TTCCCAGGTA CAATGAAATA GCCAGGCCAT TATACACACT AATTACGGGA ACTCAGAAAG 420 
CCAATACCCA TTTAGTAGAA TGGACACCTG AAGCAGAAGC GGCTTTCCAG GCCCTAAAGA 480 
10 AGGCqCTAAT CCAAGCCCCA GTGTTAAGCT TGCCAATGGA GCAAGACTTT TCTTTATATG 540 
TCACAGAAAA AAAAACAGGA ATAGCTCTAG AAGTCCTTAC ACAGGTCCGA GGGACCAGCT 600 
TACAACACAT GGCATACCTG AGTAAGGAAA CTGATGTAGT GGCAAAGGGT TGGACTCATT 660 

15 

GTTTACAGGT AGTGGCAGCA GTAGCAGTCT TAGCATCTGA AGCAGTTAAA ATGATACAGG 720 
GAAGANATCT TACTGTGTGG ACATCTCATG ATGTGAACGG CATACTCACT GCTAAAGGAG 780 
20 ACTGTGGCTG TCAGACAACC ATTTGCTTAA ATATCAGGCT CTATCACTTG AANGGCCAGT 840 
GCTGCCACTG TGCACTTGTG CAA^JTCTTAA CCCACCCACA TTTCTTCCAG ACAATGAAGA 900 
AAAGATAGAA CATAACTGTC AACAAGTGAT TGTTCAAACC TACACCGCTC GAAGGGACCT 960 

25 

TCTAGAGGTT CCCTTGACTG ATCCTGAGCT CAACTTCTAT ACTGATGGAA GTTCCTTTTG 1020 
TAGAAAAAGG ACTTCGAAAG GCGGGTATGC AGTGGCCAGT GATAATGGAA TACTTGAAAG 1080 
30 TAATCCCTTC ACTCCAGAAA CTAGCATTCA GCTGGCAGAA TTAATAGCCT TCACTTGGGC 1140 
ATTAGAACAC AGGAGAAGGA AAAGGAGTAA ATATATATAC AGACTCCAAG TATGCTTACT 1200 
TAGTCfiTnrja Tnr.rr'A'rnr'ii /ir-anTmnnoR i>/«n^<> 

" «wi^nv»r» ^>n^>rvrvnVT^^un nl lUU i AMCT TCTGAGGGAA 1260 

35 

CACCTATCAA ACATCAGGAA GCCATTAGGA GATTATTACT GGCTGTACAG AAACCTAGAG 1320 
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GTGGCAGTCT TACATGGCCG AGATCATCAG AAAGGAAAAG AAAGGGAAAT AGAAGGGAAC 1380 
TGCCAAGTGG ATATTGAAGC CAAAAGAGCT GCAAGGCGGG ACCCTCCATT AGAAATGCTT 1440 

5 

ATAGAAGGAC CCCTAGTACA GGGCAATCCC CTTCAGGAAA CCAAGCCCCA ATACTCAGCA 1500 
GAAGAAATGG AATGGGGAAC CTCATGAGGA CATAGTTTCC TCCCCTCAGG ATGGCTAGCC 1560 
10 ACCAAAGAAG GAAAAATACT TTTGCCTGCA GCTAACCAAT GG AAATTACT TAAAACCCTT 1620 
CACCAAACCT TTCGCTTAGG CATTGATAGC ACCCATCAGA TGGCTAAATC ATTATTTACT 1680 
AGACCACACC TTTTCAAAAC TATCAAGCAG ACAGTTAGGG CCTGTGAAGT GTGCCAAAGA 1740 

15 

AATAATCCCC TGCCTTATCG CCAAACTCCT TCAGGAGAAA AAAGAACAGG CCATTACCCA 1800 
GGAGTVAGAGT GGCAACTAGA TTTTACCCAC ATGCCCAAAT CTCAGGGATT TCAGTATCTA 1860 
20 CTAGTCTGGG TAGATACTTT CACTGGTTGG GCGGAGGCCT TCCCTTGTAG GACAGAACAG 1920 
GCCCATGAGG TAATAAAGGC ACTAATTCAT GAAATAATTC CCAGATTTGG ATTTCCCCAA 1980 
GGCTTACAGA GTGATAACGG CCCCACTTTC AAGGCTACAG TAACCCAGGG AGTATCCCAG 2040 

25 

ACATTAGACA TACAATATCA CTTACACTGA GCCCGGAC?GC CACAATCCTC AGGAAAGTTG 2100 
AGAAAATGAA TGA7VACGCTC AAATGACATC TAAAAAAGCT AACCTAAGAA ACCCACCTCT 2160 
3 0 CATGGTTTGC TCTGTTGCCT ATAGCCTTAG TAAGAATCCG AAACTCTCCC CAAAAAGCGG 2220 
GACTCAGCCC ATACGAAATG CTGTATGGAC GGCCCTTCCT AACCAATGAC CTTGTGCTTG 2280 
ACCTAGAGAT GGCCAACTTA GTTGCAGATA TCCCTCCTTA GCCAAATATC AACAAGTTCT 2340 

35 

TAAAACGTCA CAGGGAACCT GTCCCTGAGA GGAGGGAAAG GAATTATTCC AACCTGGTGA 2400 
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20 



30 



CATGGTATTA GTGAAGTCCC TTCCCTCCAA CTCCCCATCC CCTGGATACA TCCTGGGAAG 2460 



GACCCTACTC AGTCATTTTA TCTATCCCAA CCGCGGTTAA AATGGCTGGA GTAGAATCTT 2520 



GGATACATCA CATTCGAGTC AAACCCTAGA TACTGCCACA AGGAACCTGA AAATCCAGGA 2580 



GACAA 2585 



(2) INFORMATIONS POUR LA SEQ ID NO: 14: 



(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2575 paires de bases 
15 (B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 



(ii) TYPE DE MOLECULE: ADN 
(iii) HYPOTHETIQUE: NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 14: 
25 GGGATAGCCC CCATCTATTT GGCCAGGCAT TAGCCCAAGA CTTGAAGCCA ATTCTCATAC 60 
CTGGACACTC TTCTCCTTTG GTATGTGGAT GATTTACTTT TAGCTTCCTG TTCAGAAACC 120 
TTGTGCCATC AAGCCACCCA AGCACTCTTA AATTTCCTCG CTACCTGTGG CTACAAGGTT 180 



TCCAAACCAA AGACCCAGCT CTGCTCACAG CAGGTTAAAT ACTTGGGGCT AAAATTATCC 240 



AAAGGCACCA GGGCCCTCAG TGAGGAACGT ATCAAGCCTA TACTGGCTTA TCCTCATCCC 300 



35 CAAATCCTAA AGCAACTAAG AGAGTTCCTT AGCATAACAG GTTTCTGCTG AATATGGATT 360 
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CCCAGGTATG GCAAAATAGC CAGACCATTA TATACGCTAA TTAAGGAAAC TCAGAAAGCC 420 
AATACCCATT TAGTAAGATG GATACCTGAA GCAGAAGCAG CTTTCCAGGC CCTAAAGAGG 480 
GCCCTAACCC AAGCCCCAGT GTTAAGCTTG CCAACAGGGC AAGACTTTAC TTCGTATGTC 540 
ACAGAAAAAA CAGGAAATAG CTCTAGGAGT CCTTACACAA GTCTGAGGGA TGAGCTTGCA 600 
ACCCATGGCA TACCTGAGTA AGGAAATTGA TGTAGTGGCA AAGGGTTGGC CTCATTGTTT 660 
ATGGGTAGTG GCGGCAGTAG CAGTCTTAGC ATCTGAAGCA GTTAAAATGA TACAGGGAAG 720 
AGATCTTACT GTGTGGACAT CTCATGATGT GAATGGCATA CTCACTGCTA AAGGAGACTT 780 
GTGGCTGTCA GACAACCATT TACTTAAATA TCAGGCTGTA TTACTTGAAG GGCCAGTGCA 840 
GCAACTGCGC AGTTGTGCAG CTCTTAACCC AGCCACATTT CTTCCAGACA ATGAAGATAG 900 
AACATAACTG CCAACAAGTA ATTTCTCAAA CCTAGGCCGC TCGAGGGAAC CTTTTAGAGG 960 
TTCCCTTAAC TGATCCCGAC CTCAACTTGT ATACTGATGG AAGTTCCTTT GTAGAAAAAG 1020 
GACTTTGAAA AGTGGGGTAT GCAGTGCTCA GTGATAATGG AATACTTGAA AATAATCCCT 1080 
TCATTCCAGG AACCAGCGTT CAGCTGGCAG AATTAATAGC CCTCACTCGG GCATTAGAAT 1140 
TAGGAGAAGG AAAAAGGGTA AATACACATA CAGATTCTAA GTATGTTTAC TTAGTCCTCC 1200 
GTGCCCACGC AGCAATATGG AGAGAAAGGG AATGCTTAAC TTCTGAGGGA ACACCTATCA 1260 
AACATCAGGA AGTTATTAG6 AGATTATTAT TGGCTATACA GAAACCTAAA GAGGTGGCAG 1320 
TCTTACACTG CTGGGGTGGT CAGAAAGAAA AGGAAAGGGA AATAAAAGGG AACTGCCAAG 1380 
CGGATATTGA AGCCAAAAGA GCCGCAAGGC AGGACCCTCC ATTAGAAATG CTTATAGAAG 1440 
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GACCCCTAGT ATGGGGTAAT CCCCTCCGGG AaACCAAGCC CCAAtACTTA GAAAAAGAAA 1500 
TAGAATGGGG AACCTCACGA GGACATAGTT TCCTCCCCTC AGGATGGCTA GCCACCGAAG 1560 
5 AAGGAAA7VAT ACTTTTGCCT GCAGCTAACC AATGGAAATT ACTTAAAACC CTTCACCAAA 1620 
CCTTTCACTT AGACATTGAT AGCACCCATC AGATGGCCAA ATCATTATTT ACTGGACCAG 1680 
GCCTTTTCAA AACTATCAAG CAGCTAGTCA GGGCCTGTGA AGTGTGCCGA AGAAATAATC 1740 

10 

CCATGCCTTA TCACCAAGCT CCTTCAGGAG AACAAAGAAC AGGCCATTAC CCAGGAGAAG 1800 
RVTGGCAACT AGATTTTACC CACATGCCCA AATCTCAGGG ATTTCAGTAT CTACTAGTTT 1860 
15 GGGTAGATAC TTTCACTGGT TGGGCAGAGA CCTTCCCCTG TAAGACAGAA AAGTCCCAAG 1920 
AGGTAATAAA GGCATTAGTT CATGAAATAA TTCCCAGATT CAGACTTCCC TGAGGCTTAC 1980 
AGAGTGACAA TGGCCCTGCT TTCAAGGCTA CAGTAACCCA GGAGTATCCC AGGTGTTAGG 2040 

20 

TATACAATAT CACTTACACT GCGCCTGGAG GCAGTCCTCA GGGAAGGCCG AGAAACTGAA 2100 
TGAAACACTC AAACGACATC TAAAAAAAGC TAACCCAGGA AAACCACCTC ACATGGCCTG 2160 
25 CTCTGTTGCC TATAGCCTTA CTAAGAATCC AAAACTCTCC CCAAAAAGCA GGACTTAGCC 2220 
CATACGAAAT GCTATATGGA TAGCCCTTCC TAACCAATGA CCTTGTGCTT GACTGAGAGA 2280 
GAGCCAACTT AGTTGCAGAC ATCACCTCCT TATCCAAATA TCAACAAGTT CTTAAAACAT 2340 

30 

TACAAGGAGC CTGTCCCCGA GAAGAG6GGA AGGAACTATT CCACCCTGGT GACATGGTAT 2400 
TAGTCAAGTC CCTTCCCTCT AATTCTCATT GCCTAGATAT ATCCTGGGAA GGACCCTACC 2460 
35 CAGTC .lAC ■ ACCv lAA ^JC. AGTGGAv : TGGAXi^wATC 2520 
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ACACTCGAGT CAAACCCTGG ATATTACCAA AGGAACCTGA AAATCCAGGA GACAA 2575 



(2) INFORMATIONS POUR LA SEQ ID NO: 15: 

5 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 783 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 
10 (D) CONFIGURATION: lineaire 

<ii) TYPE DE MOLECULE: ADN 

(iii) HYPOTHETIQUE: NON 

15 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 15: 





TGAGAGACAG 


GACTAGCTGG 


ATTTCCTAGG 


CYGACTAAGA 


ATCCYTAAGC 


CTAGSTGGGA 


60 




AGGTGACCAC 


RTCCACCTTT 


AAACACGGGG 


CTTGCAACTT 


AGYTCACACC 


TGACCAATCA 


120 


20 


GAGAGCTCAC 


TAAAATGCTA 


ATTAGGCAAA 


GACAGGAGGT 


AAAGAAATAG 


CCAATCATYT 


180 




ATTGCMTGAG 


AGCACAGCAG 


GAGGGACAAY 


RATCGGGATA 


TA7VACCCARG 


YHTTCGAGCY 


240 




GGCAACRGCA 


GMCCCCCTTT 


GGGTCCCYTC 


CCTTTGTAT6 


GGAGCTCTGT 


TTTCATGCTA 


300 




TTTCACTCTA 


TTAAATCTTG 


CARCTGCRCT 


CTTCTGGTCC 


ATGTTTCTTA 


CGGCTYGAGC 


360 




TGAGCTTTYG 


CTCRCCRTCC 


ACCACTGCTG 


TTTGCCRCCA 


CCGCANACCY 


GCCGCTGACT 


420 


25 


CCCATCCCTC 


TGGATCMTGC 


AGGGTGTCCG 


CTGTGCTCCT 


GATCCAGCGA 


RGCRCCCATT 


480 




GCCGCTCCCA 


ATYGGGCTAA 


AGGCTTGCCA 


^GTNCCTGC 


AYGGCTAAGT 


GCCTGGGTTY 


540 




RTYCTAATTG 


AGCTGAACAC 


TANTCACTGG 


GTTCCATGGT 


TCTCTTCTGT 


GACCCACRGC 


600 




TTCTAATAGA 


RCTATAACAC 


TYACCRCATG 


GCCCT^GRTT 


CCATTCCTTG 


GAATCCRTRA 


660 




RGSCAACGAA 


CYCCASGTCA 


6AGAAYACGA 


RGCTTGCCAC 


CATCTTGGAA 


GCGGCCTGCT 


720 


30 


ACCATCTTGG 
ACA 


AAGTGGTTCA 


CCACCATCTT 


GGGAGCTCTG 


TGAGCAAGGA 


CCCCCMRGTR 


780 
783 



(2) IKFCRMATICN3 FOUR LA SEQ ID NC. IGi 

35 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
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(A) LONGUEUR: 20 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(iii) HYPOTHETIQUE : NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 16: 
TGTCCGCTGT GCTCCTGATC 

(2) INFORMATIONS POUR LA SEQ ID NO: 17: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 21 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(iii) HYPOTHETIQUE: NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 17: 
ATGCACTCTG GCTGGGCCAA T 

(2) INFORMATIONS POUR LA SEQ ID NO: 18: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 21 paires de bases 

(B) TYPE: nucleotide 
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(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin§aire 

(ii) TYPE DE MOLECULE; ADN 
(iii) HYPOTHETIQUE: NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 18: 
ACCATTTGAC CCTCAGACAC T 

(2) INFORMATIONS POUR LA SEQ ID NO: 19: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 24 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(iii) HYPOTHETIQUE: NON 
<xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 19: 
AACCCTTTGC CACTACATCA ATTT 

(2) INFORMATIONS POUR LA SEQ ID NO: 20: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 21 paires de bases 

( B ) TYPE : nuc 1 #ot ide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin§aire 



FEUILLE DE REMPLACEMENT (REGLE 26) 



(ii) TYPE DE MOLECULE: ADN 
(iii) HYPOTHETIQUE: NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 20 
TCAGGGATAG CCCCCATCTA T 

(2) INFORMATIONS POUR LA SEQ ID NO: 21: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 22 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin§aire 

(ii) TYPE DE MOLECULE: ADN 
(iii) HYPOTHETIQUE: NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 21: 
TTGTCTCCTG GATTTTCAGG TT 

(2) INFORMATIONS POUR LA SEQ ID NO: 22: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 20 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(ii) TYPE DE MOLECULE: ADN 
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(iii) HYPOTHETIQUE: NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 22: 

5 

GGACCCTACC CAGTCATTTT 

(2) INFORMATIONS POUR LA SEQ ID NO: 23: 

10 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 20 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 
15 (D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 

(iii) HYPOTHETIQUE: NON 

20 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 23: 
ATCAGGAGCA CAGCGGACAC 

25 

(2) INFORMATIONS POUR LA SEQ ID NO: 24: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 22 paires de bases 
30 (B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 
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(ii) TYPE DE MOLECULE: ADN 



(iii) HYPOTHETIQUE: NON 
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(jci) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 24: 
GGACATCCAA AGTGATACAT CC 

5 

(2) INFORMATIONS POUR LA SEQ ID NO: 25: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
10 (A) LONGUEUR: 21 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lin#aire 

15 (ii) TYPE DE MOLECULE: ADN 

(iii) HYPOTHETIQUE: NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 25: 



20 



AATGTATGGC CTGAAGTGCA G 



(2) INFORMATIONS POUR LA SEQ ID NO: 26: 

25 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 22 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 
30 (D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
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(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 26: 
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CTTCCCAGGA TGTATCACTT TO 22 

5 (2) INFORMATIONS POUR LA SEQ ID NO: 27: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 24 paires de bases 

(B) TYPE: nucl§otide 

10 (C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 

15 (iii) HYPOTHETIQUE: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 27: 

CACTGCAGAA GAATATAAGT CGTT 24 

20 

(2) INFORMATIONS POUR LA SEQ ID NO: 28: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
25 (A) LONGUEUR: 21 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

3 0 (ii) TYPE DE MOLECULE: ADN 

(iii) HYPOTHETIQUE: NON 

(xi ) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 2S : 
35 GCTTCCAAGA TGGTGGCAAG C 21 
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(2) INFORMATIONS POUR LA SEQ ID NO: 29: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
5 (A) LONGUEUR: 678 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

10 (ii) TYPE DE MOLECULE: ADN 

(iii) HYPOTHETIQUE: NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 29: 

15 

TCAGGGATAG CCCCCATCTA TTTGGCCAGG CATTAGCCCA AGACTTGAGC CAGTTCTCAT 60 
ACCTGGATAT TCTTGTCCTT TGGTATGCGG ATGATTTACT TTTAGCCGCC CGTTCAGAAA 120 

20 CCTTGTGCCA TCAAGCCACC CAAGTGCTCT TA7VATTTCCT CGCCACCTGT GGCTACAAGG 180 

■ ■ ■ - . - .- ; . -■ jto-'- ' - ■ 

TTTCCAAACC AAAGGCTCAG CTCTGCTCAC AGCAGAAGGC TATTTACCCT AAATACTTAG 240 

GGCTGAAATT ATCCAAAGGC ACCAGGGCCC TCAGTGAGGA ATGTATCCAG CCTATACTGG 300 

25 

CTTATCCTTA TCCCAAAACC CTAAAACAAC TAAGAAGGTT CCTTGGCATA ATAGGCATAA 360 

CAGGCATAAC AGGTTTCTGC TGAATATGGA TTCCCAAGTA CGGCAAAATA GCCAGACCAT 420 

30 TATATACACT AATTAAGGAA ACTCAGAAAG CCAATACCCA TTTAGTAAGA TGGACACCTG 480 

AAGCAGAGGC AGCTTTCCAG GCCGTAAAGA ACACCCTAAC CCAAGCCCCA GTGTTAAGCT 540 

TGCCAGCGGG GCAAGACTTT TCTTXCTGrG TCACAGAAAA AATAGGAATA GCTNTAGGAG 600 

35 

TCCTTACACA GGTCCGAGGG ACCAGCTTGC AACCCATGGC ATACCTGAGT AAGGAAATTG 660 
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ATGTAGTGGC AAAGGGTT 678 



5 (2) INFORMATIONS POUR LA SEQ ID NO: 30: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 536 paires de bases 

(B) TYPE: nucleotide 

10 (C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lin^aire 

(ii) TYPE DE MOLECULE: ADN 

15 (iii) HYPOTHETIQUE: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 30: 

CCAATCTCCA TGTTGTATCC CCTTCCCCAA CTAATAAGGA CCCCCCTTTC AACCCAAACA 60 

20 

GTCCAAAAGG ACATAGACAA AGGAGTAAAC AATGAACCAA AGAGTGCCAA TATTCCCTGG: 120 
TTATGCACCC TCCAAGCGGT GGGAGAAGAA TTCGGCCCAG CCAGAGTGCA TGTACCTTTT 180 
25 TCTCTCTCAC ACTTGAAGCA AATTAAAATA GACCTAGGTA AATTCTCAGA TAGCCCTGAT 240 
GGCTATATTG ATGTTTTACA AGGATTAGGA CAATCCTTTG ATCTGACATG GAGAGATATA 300 
ATATTACTGC TAAATCAGAC GCTAACCTCA AATGAGAGAA GTGCTGCCAT AACTGGAGCC 360 

30 

CGAGAGTTTG GCAATCTCTG GTATCTCAGT CAGGTCAATG ATAGGATGAC AACGGAGGAA 420 
AGAGAACGAT TCCCCACAGG GCAGCAGGCA GTTCCCAGTG TAGCTCCTCA TTGGGACACA 480 
35 GAATCAGAAC ATGGAGATTG GTGCCGCAGA CATTTAAAGC TTTCCCCGGG TACCGA 536 
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(2) INFORMATIONS POUR LA SEQ ID NO: 31: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
5 (A) LONGUEUR: 591 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

10 (ii) TYPE DE MOLECULE: ADN 

(iii) HYPOTHETIQUE: NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 31: 

15 

CCATGGCCAT CTACACTGAA CAAGATTTAT ACAATCATGT CGTACCTAAG CCCCACAACA 60 
AAAGAGTACC CATTCTTCCT TTTGTTATCA GAGCAGGAGT GCTAGGCAGA CTAGGTACTG 120 
20 GCATTGGCAG TATCACAACC TCTACTCAGT TCTACTACAA ACTATCTCAA GAAATAAATG 180 
GTGACATGGA ACAGGTCACT GACTCCCTGG TCACCTTGCA AGATCAACTT AACTCCCTAG 240 
CAGCAGTAGT CCTTCAAAAT CGAAGAGCTT TAGACTTGCT AACCGCCAAA AGAGGGGGAA 300 

25 

CCTGTTTATT TTTAGGAGAA GAACGCTGTT ATTATGTTAA TCAATCCAGA ATTGTCACTG 360 
AGAAAGTTAA AGAAATTCGA GATCGAATAC AATGTAGAGC AGAGGAGCTT CAAAACACCG 420 
30 AACGCTGGGG CCTCCTCAGC CAATGGATGC CCTGGGTTCT CCCCTTCTTA GGACCTCTAG 480 
CAGCTCTAAT ATTGTTACTC CTCTTTGGAC CCTGTATCTT TAACCTCCTT GTTAAGTTTG 540 
TCTCXTCCAG AATTGAAGCT GTAAAGCTAC AGATGGTCTT ACAAATCTAG A 591 

35 
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(2) INFORMATIONS POUR LA SEO ID NO: 32: 



(i) 



CARACTERISTIQUES DE LA SEQUENCE: 



(A) LONGUEUR: 364 paires de bases 



(B) TYPE: nucleotide 



(C) NOMBRE DE BRINS: simple 



(D) CONFIGURATION: lin§aire 



(ii) 



TYPE DE MOLECULE: ADN 



10 



(iii) 



HYPOTHETIQUE: NON 



(xi) 



DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 32: 



15 CTAACCTGAG GATCCAGCAG CAGGACTGAG GGTGCCCGGG GCAAGTGCCA GCCCATGCCA 60 

TCACCCTCAG AGCCCCGGGT ATGTTTGACC ATTGAGAGCC AGGAAGTTAA CTGTCTCCTG 120 

GACACTGGCG CAGCCTTCTC AGTCTTACTT TCCTGTCCCA GACAATTGTC CTCCAGATCT 180 

20 

GTCACTATCC GAGGGGTCCT AGGACAGCCA GTCACTACAT ACTTCTCTCA GCCACTAAGT 240 

TGTGACTGGG GAACTTTACT CTTTTCACAT GCTTTTCTAA TTATGCCTGA AAGCCCCACT 300 

25 CCCTTGTTAG GGAGAGACAT TTTAGCAAAA GCAGGGGCCA TTATACACCT GAACAAGCTT 360 

GAAA 364 

30 (2) INFORMATIONS POUR LA SEQ ID NO: 33: 



(i) CARACTERISTIQUES DE LA SEQUENCE: 



(A) LONGUEUR: 538 acides amines 



<tt) rxfxii acide amine 
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(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin^aire 
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(ii) TYPE DE MOLECULE: prot§ine 
(iii) HYPOTHETIQUE: NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 33: 

Met Gly Leu Pro Tyr His lie Phe Leu Cys Ser Val Leu Ser Pro Cys 
15 10 15 

Phe Thr Leu Thr Ala Pro Pro Pro Cys Arg Cys Met Thr Ser Ser Ser 
20 25 30 

Pro His Pro Glu Phe Leu Trp Arg Met Gin Arg Pro Gly Asn He Asp 
35 40 45 

Ala Pro Ser Tyr Arg Ser Leu Ser Lys Gly Thr Pro Thr Phe Thr Ala 
50 55 60 

His Thr His Met Pro Arg Asn Cys Tyr His Ser Ala Thr Leu Cys Met 
6? 70 75 80 

His Ala Asn Thr His Tyr Trp Thr Gly Lys Met He Asn Pro Ser Cys 
85 90 95 

Pro Gly Gly Leu Gly Val Thr Val Cys Trp Thr Tyr Phe Thr Gin Thr 
100 105 110 

Gly Met Ser Asp Gly Gly Gly Val Gin Asp Gin Ala Arg Glu Lys His 
115 120 125 

Val Lys Glu Val He Ser Gin Leu Thr Gly Val His Gly Thr Ser Ser 
130 135 140 

Pro Tyr Lys Gly Leu Asp Leu Ser Lys Leu His Glu Thr Leu Arg Thr 
145 150 155 160 
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His Thr Arg Leu Val Ser Leu Phe Asn Thr Thr Leu Thr Gly Leu His 
165 170 175 

5 Glu Val Ser Ala Gin Asn Pro Thr Asn Cys Trp lie Cys Leu Pro Leu 

180 185 190 

Asn Phe Arg Pro Tyr Val Ser lie Pro Val Pro Glu Gin Trp Asn Asn 
195 200 205 

10 

Phe Ser Thr Glu lie Asn Thr Thr Ser Val Leu Val Gly Pro Leu Val 
210 215 220 

Ser Asn Val Glu lie Thr His Thr Ser Asn Leu Thr Cys Val Lys Phe 
15 225 230 235 240 

Ser Asn Thr Thr Tyr Thr Thr Asn Ser Gin Cys lie Arg Trp Val Thr 
245 250 255 

20 Pro Pro Thr Gin lie Val Cys Leu Pro Ser Gly lie Phe Phe Val Cys 

260 265 270 

Gly Thr Ser Ala Tyr Arg Cys Leu Asn Gly Ser Ser Glu Ser Met Cys 
275 280 285 

25 

Phe Leu Ser Phe Leu Val Pro Pro Met Thr lie Tyr Thr Glu Gin Asp 
290 295 300 

Leu Tyr Ser Tyr Val lie Ser Lys Pro Arg Asn Lys Arg Val Pro lie 
30 305 310 315 320 

Leu Pro Phe Val lie Gly Ala Gly Val Leu Gly Ala Leu Gly Thr Gly 
325 330 335 

35 lie Gly Gly lie Thr Thr Ser Thr Gin Phe Tyr Tyr Lys Leu Ser Gin 

340 345 350 
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Glu Leu Asn Gly Asp Met Glu Arg Val Ala Asp Ser Leu Val Thr Leu 
355 360 365 . 

Gin Asp Gin Leu Asn Ser Leu Ala Ala Val Val Leu Arg Asn Arg Arg 
370 375 380 

Ala Leu Asp Leu Leu Thr Ala Glu Arg Gly Gly Thr Cys Leu Phe Leu 
385 390 395 400 

Gly Glu Glu Cys Cys Tyr Tyr Val Asn Gin Ser Gly He Val Thr Glu 
405 410 415 

Lys Val Glu Glu He Pro Asp Arg He Gin Arg He Ala Glu Glu Leu 
420 425 430 

Arg Asn Thr Gly Pro Trp Gly Leu Leu Ser Arg Trp Met Pro Trp He 
435 440 445 

Leu Pro Phe Leu Gly Pro Leu Ala Ala He He Leu Leu Leu Leu Phe 
450 455 460 

Gly Pro Cys He Phe Asp Leu Leu Val Asn Phe Val Ser Ser Arg He 
465 470 475 480 

Glu Ala Val Lys Leu Gin Met Glu Pro Lys Met Gin Ser Lys Thr Lys 
485 490 495 

He Tyr Arg Arg Pro Leu Asp Arg Pro Ala Ser Pro Arg Ser Asp Val 
500 505 510 

Asn Asp He Lys Gly Thr Pro Pro Glu Glu He Ser Ala Ala Gin Pro 
515 520 525 

Leu Leu Arg Pro Asn Ser Ala Gly Ser Ser 
530 535 
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# 
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(2) INFORMATIONS POUR LA SEQ ID NO: 34: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 52 acides amin#s 

(B) TYPE: acide amine 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 



(ii) TYPE DE MOLECULE: peptide 

(iii) HYPOTHETIQUE: NON 

15 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 34: 

Met Glu Pro Lys Met Gin Ser Lys Thr Lys lie Tyr Arg Arg Pro Leu 
15 10 15 

20 Asp Arg Pro Ala Ser Pro Arg Ser Asp Val Asn Asp lie Lys Gly Thr 

20 25 30 

Pro Pro Glu Glu lie Ser Ala Ala Gin Pro Leu Leu Arg Pro Asn Ser 
35 40 45 



Ala Gly Ser Ser 
50 



30 (2) INFORMATIONS POUR LA SEQ ID NO: 35: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 48 acides amin§s 

(B) TYPE: acide amln6 

35 (C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin§aire 
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(ii) TYPE DE MOLECULE: peptide 
(iii) HYPOTHETIQUE: NON 

5 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 35: 

Met Leu Met Thr Ser Lys Ala Pro Leu Leu Arg Lys Ser Gin Leu His 
1 5 10 15 

10 

Asn Leu Tyr Tyr Ala Pro He Gin Gin Glu Ala Val Arg Ala Val Val 
20 25 30 

Gly Gin Pro Pro Gin Gin His Leu Gly Phe Pro Val Glu Met Gly Asp 
15 35 40 45 



■J. 
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